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PROLOGO 


Estimada profesora, estimado profesor: 

Como parte de una estrategia de largo plazo para la 
profesionalizacion docente en el campo de las matematicas, el 
DepartamentodeMatematica Educativadel Centro deinvestigacion 
y de Estudios Avanzados (Cinvestav) y la Subsecretaria de Educacion 
Media Superior de la SEP, disenaron un plan para elaborar estos 
materiales dirigidos a las y los profesores de Matematicas del pais. 
En un segundo momenta, con la colaboracion de la red de egresados 
de Matematica Educativa y el apoyo de la Sociedad Matematica 
Mexicana, llevaremos a cabo mesas, foros, seminaries, cursos y 
diplomados mediante un Plan Nacional para la Profesionalizacion 
Docente en las Matematicas Escolares. 

Quienes estamos interesados en el aprendizaje de las matematicas 
no podemos reducir los conceptos a sus definiciones, ni limitar las 
experiencias didacticas a la repeticion memoristica de algoritmos 
y resultados. Aprender matematicas no puede limitarse a la mera 
copia del exterior a traves de resultados previamente elaborados, 
o digamos que, a su duplicado; sino mas bien, es el resultado de 
construcciones sucesivas cuyo objetivo es garantizar el exito ante 
una cierta situacion de aprendizaje. 

Una consecuencia educativa de este principio consiste en 
reconocer que tenemos todavia mucho que aprender al analizar 
los propios procesos de aprendizaje de nuestros alumnos; nos 
debe importar, por ejempio, saber como los jovenes del bachillerato 
operan con los numeros, como entienden la pendiente de una recta, 
como construyen y comparten significados relativos a la nocion de 
funcion o proporcionalidad, o como se explican a si mismos nociones 
de azar. Esta vision rompe con el esquema clasico de ensenanza 
segun el cual, el maestro ensena y el alumno aprende. Estos textos 
se disenaron para ayudar al docente a explorar y usarlos para una 
ensenanza renovada aprovechando las formas naturales en que los 
estudiantes razonan sobre matematicas y sobre lo que aporta a 
este respecto la investigacion en Matematica Educativa. 
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El papel del profesor en esta perspectiva es mucho mas active y 
propositivo, pues sobre el o ella recae mas la responsabilidad del 
disenoy coordinacionde lassituacionesdeaprendizaje. Actualmente 
se considera al profesor como un profesional reflexive, que decide, 
disefia, aplica y experimenta estrategias de accion para lograr el 
aprendizaje de sus alumnos. De manera que aprender matematicas 
no se reduce a recordar formulas, teoremas o definiciones para 
resolver problemas mediante la imitacion de las explicaciones del 
profesor en clase o con apego a los metodos ilustrados en los textos 
escolares. 

Los resultados de las pruebas nacionales de corte masivo, utilizadas 
con fines de investigacion, permitirian saber cuales conceptos y 
procesos requieren todavia adaptaciones progresivas con el fin de 
mejorar su aprendizaje. Si bien los ultimos resultados de las pruebas 
de logro academico estandarizadas muestran un incremento en el 
porcentaje de la poblacion estudiantil con resultados satisfactorios 
y un decremento en el complemento, aun falta mejorar la atencion 
en algunas tematicas particulares. 

Gracias a la labor que Neva a cabo el Departamento de Matematica 
Educativa del Cinvestav, a traves de sus profesores, egresados e 
investigadores en formacion, sabemos cuales asuntos, de naturaleza 
transversal, resultan fundamentales para el aprendizaje de las 
matematicas y de las ciencias, como puede ser el desarrollo del 
pensamiento y lenguaje variacional, la constitucion de un lenguaje 
grafico para lasfunciones, el desarrollo del pensamientotrigonometrico, 
el pensamiento proporcional y el pensamiento estadistico. Estos 
asuntos siguen siendo un reto de la mayor importancia para mejorar 
los aprendizajes entre los estudiantes del bachillerato mexicano. 

Por esta razon, los cinco volumenes de esta coleccion fueron 
pensados para el docente de matematicas. Su lectura, analisis y 
discusion permitira mejorar los procesos de aprendizaje matematico. 
Los titulos de los textos de la serie son los siguientes: 

Vol. 1 - Lenguaje grapco de funciones. Elementos de precalculo 

- Rosa Maria Farfan Marquez 

Vol. 2 - Desarrollo del pensamiento trigonometrico 

- Gisela Montiel Espinosa 

Vol. 3 - Desarrollo del pensamiento y lenguaje variacional 

- Ricardo Cantoral Uriza 
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Vol. 4 - La transversalidad de la proporcionalidad 

- Daniela Reyes Gasperini 

Vol. 5 - Elementos de estadistica y su didactica a nivel bachillerato 

- Ernesto Sanchez Sanchez 

Segun la profesora Regine Douady, saber matematicas precisa de 
dos aspectos. Por un lado, se refiere a la disponibilidad funcional 
de nociones y teoremas matematicos para enfrentar problemas e 
interpretar nuevas situaciones. En este proceso, dichas nociones 
y teoremas tienen un estatus de herramienta, en tanto que sirven 
para que alguien actue sobre un problema en determinado contexto. 
Por otra parte, tambien significa identificar a las nociones y a los 
teoremas como parte de un cuerpo de conocimientos reconocidos 
socialmente. Es ahi donde se formulan definiciones, se establecen 
relaciones entre nociones mediante teoremas y se prueban las 
conjeturas adquiriendo entonces el estatus de objeto. Al adquirir 
ese estatus, estan descontextualizados y despersonalizados para 
permitir su aprendizaje. Este proceso de descontextualizacion 
y despersonalizacion participa del proceso de apropiacion del 
conocimiento. Por su parte, para un profesor ensehar se refiere a 
la creacion de las condiciones que produciran la apropiacion del 
conocimiento por parte de los estudiantes. Para estos, aprender 
significa involucrarse en una actividad intelectual cuya consecuencia 
final sea la disponibilidad de un conocimiento con su doble estatus de 
herramienta y de objeto. Para que haya aprendizaje y ensehanza es 
necesario que el conocimiento sea un objeto importante, casi esencial, 
de la interaccion entre el profesor y sus alumnos. 

Esta es pues la primera de una serie de iniciativas coordinadas 
para la mejora de la educacion en el campo de las matematicas del 
bachillerato. No me resta mas que animarles a estudiar y discutir los 
materiales que ahora tienen en sus manos, el camino es largo, pero 
iremos juntos... 

Dr. Ricardo Cantoral Uriza 

Jefe del Departamento 

Matematica Educativa - Cinvestav 




INTRODUCCION 


La estadistica juega un papel fundamental en las sociedades 
actuales en las que se producen y utilizan grandes cantidades de 
informacion, pues tiene que ver con las formas en que se recogen, 
organizan y comunican conjuntos de datos y con la manera en que 
se analizan para hacer inferencias y predicciones, y para tomar 
decisiones. La estadistica extiende su radio de influencia a todas 
las disciplinas cientificas y sociales, ya que, como afirma Moore 
(2000), proporciona un metodo general util para tratar datos, 
estimar su variacion y el riesgo en situaciones de azar, de manera 
que es importante en la cultura de la mayoria de las personas. 
La caracterizacion de Moore no excluye la importancia de la 
estadistica en la vida cotidiana, pues los individuos a lo largo de 
su vida requieren entender diversidad de informacion estadistica 
que puede afectar sus vidas. Asimismo, los ciudadanos tienen que 
contender con fenomenos variables y azarosos frente a los cuales 
es necesario tomar decisiones racionales. Probablemente es el 
reconocimiento de todas estas razones lo que ha hecho que se 
incluya la estadistica en el curricula de la educacion preuniversitaria 
desde hace varias decadas. 

Por otra parte, en los ultimos anos tambien ha surgido con fuerza la 
idea de que la educacion debe asegurar la formacion de ciudadanos 
competentes, en el sentido de que puedan hacer funcionar o utilizar 
de manera efectiva el conocimiento adquirido en la escuela en su 
vida personal, social y profesional. Sin embargo, hay evidencias de 
que esto es dificil de alcanzar, y de que los anteriores curriculos, 
distintos al enfoque actual basado en el desarrollo de competencias, 
no propiciaban este tipo de educacion. En gran medida, las 
evidencias mencionadas se derivan de los resultados obtenidos 
en las pruebas de evaluacion nacionales e internacionales. En 
particular, cuando estos resultados ban sido negativos, la sociedad 
los ha interpretado como deficiencias o bajos logros en los 
objetivos educativos nacionales. Con la intencion de revertir esta 
situacion, diversos autores ban sugerido replantear los contenidos 
curriculares, reforzar la formacion y actualizacion de profesores y 
promover el cambio de las practicas docentes en las aulas. 
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En este trabajo se intenta proporcionar al profesor un instrumento 
que lo apoye para realizar una transicion que lo conduzca hacia un 
enfoque de la ensenanza de la estadistica basado en el desarrollo de 
competencias. Para hacerlo, hemos elegido tres temas tradicionales 
del curriculo: graficas, medidas de tendencia central y medidas de 
variacion. Proponemos en el primer capitulo un acercamiento clasico 
del tema. En el segundo, se exponen algunos de los resultados mas 
relevantes que se ban propuesto desde la didactica de la estadistica 
con relacion a los temas elegidos. En este capitulo queda en 
evidencia que el enfoque clasico no es suficiente para generar los 
conocimientos, habilidades y actitudes que se requieren para que 
los estudiantes sean usuarios competentes de la estadistica. En el 
tercer capitulo se ofrecen algunos de los aspectos importantes que 
permiten entender hacia donde conviene conducir la ensenanza de 
la estadistica. Especificamente, se revisan cuales son las relaciones 
entre la educacion estadistica y la propuesta de un curriculo por 
competencias. Se argumenta que la estadistica, por su propia 
naturaleza, es especialmente adaptable a dicha propuesta y que la 
forma de concretarla en el aula es mediante la ensenanza basada 
en proyectos. El capitulo 4 consiste en un ejempio de un proyecto 
propuesto por Batanero, Diaz y Gea (2012), en el que se puede 
observar la potencialidad de este metodo de ensenanza. 
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1. GRAFICAS, CENTROS Y DISPERSION 


LAS ESCALAS DE MEDIDA 


La escala nominal. Los dates estan sobre una escala nominal 
si son nombres o etiquetas con los que se indica que tienen un 
atributo. Por ejempio, en un censo la variable "sexo" es nominal, no 
importando que los sexos se indiquen con numeros, por ejempio 
“0” para “hombre” y “1” para “mujer”; lo mismo los valores 0 y 1 son 
solo etiquetas. Ni el orden ni las operaciones que se pueden hacer 
con estos, o cualesquiera otros numeros, tienen significado alguno 
cuando son nominales. 

La escala ordinal. Los dates estan sobre una escala ordinal si son 
tales que pueden ser ordenados y dicho orden tiene significado. Por 
ejempio, los meses del ano estan a una escala ordinal, pues estan 
ordenados de acuerdo con su posicion en el ano, tiene sentido 
decir que enero esta antes de febrero y este antes que marzo, etc. 
En ciertas condiciones puede ser conveniente asociar los meses 
del ano con los numeros del 1 al 12, pues el orden de estos tiene 
significado. En una escala ordinal la diferencia entre dos elementos 
o su distancia no necesariamente tiene significado; por ejempio, en 
la anterior asignacion, la distancia de 1 a 6 es 5, esto no quiere decir 
que la distancia de “enero’XD a “junio” (6) es “mayo” (5). 

La escala de intervalos. Los datos estan en una escala de intervalos si 
tanto el orden como la distancia entre elementos son significativos. El 
ejempio mas claro de datos que estan sobre una escala de intervalos 
son los datos que provienen de mediciones de la temperatura en 
grades centigrados, los cuales se pueden ordenar y el intervalo 
entre dos valores es significative, ya que representa la temperatura 
que se necesita aumentar a la primera temperatura para llegar a 
la segunda. En las escalas de intervalos el cero no es significative, 
es convencional. La temperatura de cero grades centigrados no 
significa ausencia de calor. 

La escala de razon. Los datos estan sobre una escala de razon si 
pueden ordenarse, los intervalos (o diferencias) son significativos y 
el cero tambien es significative. Estas propiedades de los datos de 
una escala de razon hacen significativas las razones entre los datos. 
Las medidas de distancia estan en una escala de razon, ya que se 
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pueden ordenar, la diferencia entre dos distancias es significativa y 
una distancia cero representa cero desplazamientos; si la razon de 
dos distancias es Vz, significa que una distancia es la mitad de la otra. 

TABLAS DE DATOS Y GRAFICAS 

La primera organizacion que se le suele dar a los dates, una vez 
que son recogidos, consiste en indicar el conjunto de medidas 
observadas de la variable en estudio junto con el numero de veces 
en que cada medida u observacion ocurre. Los arreglos que ofrecen 
dicha informacion se llaman distribuciones de frecuencia. En la figura 
1 se muestra una distribucion en forma de tabla y en forma de 
diagrama de columnas sobre mortalidad por cancer. 

Panorama Internacional de la Mortalidad por cancer 


Mortalidad por cancer. 
Panorama Internacional, 2007 


Tipos de cancer 

2007 

Pulmon 

1,400,000 

Mama 

549,000 

Colon 

677,000 

Estomago 

866,000 

Higado 

653,000 


Fuente: Informe de Cancer Organizacion 
Mundial de Salud. 


Mortalidad por cancer. 
Panorama Internacional, 2007 



Pulmon Estomago Colon Higado Mama 
Tipos de cancer 


Figura 1. Tabla de frecuencia y diagrama de columnas de los tipos de cancer mas 
frecuentes por Mortalidad. 

Fuente: http://www.dgepi.salud.gob.mx/2010/PDFS/PUBLICACIONES/MONOGRAFIAS/ 
PEPID_TUMORES_MALIGNOS_MEX_2010.pdf (consultada el 07/07/13). 
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Graficas basicas de estadfstica 

Si se quiere presentar en una grafica los dates de una tabla con 
una sola fila (o columna) de dates, solo se puede elegir entre los 
siguientes cinco tipos basicos: 






Diagramas e sectores 


Diagramas de barras 


Diagramas de columnas 


Histograma 



Figura 2. Tipos de graficas. 

Hay dos criterios generales para elegir el tipo de grafica para 
presentar los datos: 

Diagrama de sectores 

Este diagrama resulta conveniente cuando la variable es nominal u 
ordinal, con no mas de seis valores distintos; es importante tener 
en cuenta que los datos deben cubrir una totalidad (100%). Cada 
sector es proporcional a la frecuencia del valor de la variable que 
representa. En el ejempio de la figura 3, se presenta un diagrama 
de sectores del numero de municipios gobernados por cada partido 
(en 2011): 









































16 


ELEMENTOS DE ESTADISTICA Y SU 
DIDACTICA A NIVEL BACHILLERATO 



Partido 

Municipios 

PRI 

15210 

PAN 

473 

PRD 

322 

Otros 

135 


Figura 3. Tabla de frecuencia de municipios gobernados por los partidos. 

Fuente: http://www.fenamm.org.nnx/site/index.php?option=com_ 
conten&id=187&ltemid=123(Consultada en:07/07/213). 

Diagrama de barras 

Este tipo de diagrama tambien es una opcion conveniente cuando 
la variable es nominal y, a diferencia del diagrama de sectores, no 
pierde claridad aun cuando hay un numero grande de valores de la 
variable. Por ejempio, 


Serranias de Nayarit' 
Huasteca Alta Hidalguense 
Sierra Madre del Sur y Franja 
Neovolcanica de Jalisco 
Centro de Veracruz 

Cuenca Alta del Balsas 

Los Tuxtias' 
Sierra Norte de Oaxaca 
Coordillera Costera del Sur 
Sierras del Sur de Chiapas ' 

] 

1 






i 



■ I 

■ 

1 







Montanas del Norte y Altos de Chiapas 
Canadas de Ocosingo 

■ 1 

c 

C 

so 100 150 200 250 300 350 

Densidad (no. habitantes/ km^) 


Figura 4. Densidad poblacional (Num. de habitantes por kilometro cuadrado) en los 
bosques de montana de Mexico y su area de influencia (3 Km). 

Fuente.-Conabio (2010). El bosque mesofilo de montana en Mexico: Amenazas y 
oportunidades para su conservacion y manejo sostenible. Mexico: Gobierno Federal. 

Diagrama de columnas 

Seprefiereun diagramade columnas cuando la variable independiente 
tiene valores sobre una escala ordinal. A diferencia del diagrama de 
barras, el de columnas no admite una reordenacion de los valores 
de la variable independiente, ya que estos tienen un orden natural. 
Por ejempio, supongamos que la variable independiente toma los 
valores de los meses del aho, resultaria inapropiado seguir un orden 
diferente al de la direccion del tiempo. 
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Veamos la grafica “Evolucion del numero de bibliotecas”, que se 
presenta a continuacion. Observemos que los anos que van de 
1980 a 1997 constituyen la variable independiente, la cual ahora 
se representa en el eje horizontal; la variable dependiente “numero 
de bibliotecas” se representa en el eje vertical. Este diagrama 
tiene algunos elementos decorativos, como presentar las barras 
con efecto de tercera dimension y el jaspeado de la superficie de 
fondo detras de las barras. Por lo demas, las Imeas horizontales y 
las divisiones en los ejes son elementos necesarios de una buena 
grafica de columnas; los diagramas en los que se omite alguno de 
estos pueden ser aceptables, pero baja su calidad. 


Evolucion del numero de bibliotecas 
1980-97 


12 000 


10 000 


8 000 


6 000 


4 000 


2 000 


0 

808182838485868788899091929394959697 



Figura 5: Evolucion del numero de bibliotecas de 1980-1997. 

Fuente: INEGI, Anuario Estadi'stico, Estados Unidos Mexicanos, 1999. 

Nota: En muchos textos se refieren a los diagramas de columnas tambien como 
diagramas de barras. Lo importante no es el nombre, sino la eleccion de la forma 
adecuada para mejorar la comunicacion. 
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Histograma y grafica poligonal 

Estas formas de presentacion de la informacion se prefieren cuando 
la variable tiene valores sobre una escala de intervalo o de razon. 
Esto significa que el eje horizontal es una recta numerica en la que 
cada punto corresponde a un numero significativo. El histograma 
se compone de una serie de rectangulos, cada uno de los cuales 
tiene como base un intervalo de clase y, generalmente, la altura de 
cada rectangulo representa la frecuencia con la que se presentan 
datos contenidos en el intervalo que se representa. 

El histograma no es simplemente un diagrama de columnas con las 
barras juntas, ya que en este tipo de grafica tiene sentido el ancho 
de los rectangulos e incluso en algunos disenos los intervalos puede 
no ser iguales. Mientras que en un diagrama de columnas el espacio 
entre las columnas y su ancho es convencional, en el histograma el 
ancho de los rectangulos porta informacion. 

Ejempio: 

Tabla 1. Embarazadas segun aumento de peso durante la 
gestacion, Centro de Salud “Luis Pasteur”,1991 


Aumento de peso* 

Numero 

Porcentaje 

6 a 8 

68 

53.13 

9 a 10 

24 

18.75 

11 a 12 

16 

12.50 

13 a 14 

20 

15.62 

Total 

128 

100.00 


* En kilogramos enteros. 

Para hacer el histograma de la informacion que esta representada 
en la tabla se debe observar que la variable independiente “Aumento 
de peso” es una variable continua, pero si se dibujan los intervalos 
tal como se miran en la tabla obtendriamos espacios vacios: 


6 7 8 9 10 11 12 13 14 

Figura 6. Ejempio de histograma. 

Pero es facil darse cuenta que no es poco probable que haya habido 
personas que aumentaron alrededor de 8.25 kg o 8.75 kg, es decir, 
que seguramente se obtuvieron valores que corresponden a los 
“hoyos” de la recta dibujada arriba. Se puede suponer que quienes 
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colectaron los dates llevaron a cabo un redondeo. Asi, aumentos 
de pesos cerca de 8.25 lo registraron como 8 y 8.75 como 9. Bajo 
este supuesto (que es el mas natural en estos casos), los “hoyos” 
se “rellenan” dividiendolos entre dos y adhiriendolos a los intervales 
adyacentes. Al hacer lo anterior se obtienen nuevos intervales que 
llenan el segmento en el que varian los dates. Los puntos medios 
de cada intervale se llaman marcas de clase. A continuacion 
se presentan los intervales y su marca de clase y mas abajo el 
histograma correspondiente: 


(5.5.8.5) su marca de clase es 7 

(8.5.10.5) su marca de clase es 9.5 

(10.5.12.5) su marca de clase es 11.5 

(12.5.14.5) su marca de clase es 13.5 


6 7 8 9 10 11 12 13 14 Kg 



Figura 7. Ejempio de histograma. 


ESTADISTICOS IMPORTANTES 

A cada conjunto de dates se le pueden asociar valores que dicen algo 
acerca de sus elementos, a esos valores se les llama estadisticos. 
Por ejempio, si los dates de una coleccion estan sobre una escala al 
menos ordinal, su valor minimo es un estadistico; este proporciona 
informacion de todo el conjunto, a saber, que cualquier valor de la 
coleccion es mayor o igual que el. Los estadisticos mas conocidos y 
utilizados son la moda, la mediana y la media o promedio. 

La moda es el date o puntuacion que aparece en la lista con mayor 

frecuencia. 

La moda es el estadistico mas importante de una lista de dates 
cuando estos estan sobre una escala nominal. En el ejempio 3.1 lo 
importante es saber que cancion gano con un numero mayor de 
llamadas. En el segundo ejempio la moda de los dates es 49, pero 
este valor no es tan importante, en su lugar, es mas importante el 
intervale de moda, es decir, el intervale que tiene mayor numero de 
puntuaciones: (51-60); a ese intervale pertenece el resultado que 
obtuvo Juan. 
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La mediana de una lista de dates es el numero que divide la lista en 
dos partes, de tal manera que la mitad de los dates sen meneres e 
iguales a la mediana y la etra mitad sen mayeres e iguales a ella. 


Per ejempio: 24 

29 

31 

31 

35 

37 

38 

39 

42 

43 

45 

45 

47 

48 

49 

49 

49 

49 

50 

51 

51 

52 

53 

53 

53 

54 

54 

55 

56 

56 

57 

58 

59 

63 

63 

64 

64 

66 

68 

69 

69 

70 

73 

73 

74 

75 

78 

81 

84 

90 


La mediana es, entences, el valer intermedia entre 53 y 54, es decin 
53.5. Observe que en este case la mediana ne ceincide cen ningune 
de les valeres de la lista. De pase pedemes agregar cen relacion a la 
preecupacion de Juan que la puntuacion que ebtuve esta per arriba 
de la mediana. 

La media o promedio de un cenjunte de dates numerices es el 
numere que se ebtiene de sumar les dates y dividirles entre 
el numere tetal de elles. 

La media es el estadistice mas utilizade cuande las puntuacienes 
estan sebre una escala de intervale e de razon. En la escuela es muy 
cenecide y utilizade el premedie, que ne es etra cesa que la media de 
las calificacienes ebtenidas. En el lenguaje de algunas especialidades 
se habla de la estatura premedie, del pese medie, etc., eses valeres 
cerrespenden cen el cencepte de media que acabames de definir. 
Ceme les valeres del ejemple anterier estan sebre una escala de 
razon, la media para elles tiene sentido, asi que pedemes obtenerla. 
Sumemos todos los valeres y el resultado de la suma lo dividimos 
entre 50: 


Suma de todos los valores=2766 
2766 


Media= 


50 


= 55.32 
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Media de datos agrupados 

En ocasiones no se cuenta con la lista de datos sino con una tabla 
de frecuencias. En esos casos tambien se puede calcular la media 
multiplicando cada marca de clase por su frecuencia, sumar todos 
los productos y finalmente dividirlo entre la suma de las frecuencias. 
Para ejemplificar como se calcula la media de datos agrupados 
veamos la tabla que corresponde a los datos del ejempio: 


Intervalo 

Marcas 

Free. 

20-29 

// 

2 

30-39 

mill 

6 

40-49 

////////// 

10 

50-59 

/////////////// 

15 

60-69 

//////// 

8 

70-79 

mill 

6 

81 - 90 

/// 

3 

91 - 100 


0 

Total 


50 


Las marcas de clase son los puntos medios de cada intervalo, en el 
caso anterior son: 

25 35 45 55 65 75 85 95 

cada uno de estos valores se multiplica por su frecuencia y se suman: 
25x2 + 35x6 + 45x10 + 55x15 + 65x8 + 75x6 + 85x3 + 95x0 = 2760 

Entonces se divide este numero entre el total de frecuencias que es 
50, obteniendose: 

2766 

Media= —— = 55.32 
50 

Debemos observar que la media de los datos agrupados no es 
exactamente igual a la obtenida cuando los datos estan sin agrupar, 
pero es muy aproximada; en el caso anterior la diferencia es solo 
0 . 11 . 
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Mediana 


Para ejemplificar el caso de la mediana en dates agrupados en 
frecuencias consideremos los dates de la tabla anterier (edad de 
las madres al tener su primer hije). Senalames anteriermente que 
cuande les dates se agrupan pierden su identidad y que la marca 
de clase asume la representatividad de les dates del intervale. En 
este case tendriames 17 mamas que tuvieren su primer hije a les 17 
anes, 15 que le tuvieren a les 24 anes y asi sucesivamente. Ceme se 
tienen 51 dates erdenades, la mediana se encuentra en la pesicion 
26 debide a que 


n + 1 
2 


51 + 1 
2 


26 


Es decir, la mediana se encuentra en el segunde intervale dade 
que el acumulade al primer intervale sen 17 dates, mientras que 
el acumulade en el segunde intervale sen 32 dates. Le anterier nes 
cenduce a que la mediana se encuentra entre el valer 21 y 27, que 
sen les limites del intervale que centiene a la mediana. 

Una expresion que nes permite calcular la mediana es la siguiente: 


Mediana = L^ + 



c 


Dende: 

Limite inferier del intervale que centiene a la mediana. 
n: Tetal de dates. 

c: Amplitud del intervale que centiene a la mediana. 

f^: Frecuencia del intervale que centiene a la mediana. 

X/: Suma de frecuencias anterieres al intervale que centiene 
a la mediana. 

Ceme se puede ver, para utilizar la formula es muy importante que 
primeramente se identifique el intervale que centiene a la mediana, 
ya que todos los elementos hacen referenda a el. 

Para el caso que estamos analizando se tiene le siguiente: 

Intervale que centiene a la mediana: 21-27 
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A 


^ 23 


L^ = 21 
n = 51 



17 


Sustituyendo: 


Mediana = L^ + 


r—s/i 



. fm . 

c = 21 + 

15 


1 


Mediana = 24.96 afios 

Observese la similitud que hay en este caso entre media aritmetica 
y la mediana, dado que los dates siguen una distribucion 
aproximadamente simetrica, lo cual se puede ver en el siguiente 
histograma. 



Edad 


Figura 8. Histograma que muestra media y mediana. 

MEDIDAS DE VARIABILIDAD O DISPERSION 

Las medidas de tendencia central no son suficientes para una adecuada 
descripcion de los dates, ya que solo nos indican el valor central 
alrededor del cual se encuentran los dates. Es necesario conocer otras 
medidas que nos indiquen el grade de dispersion o variabilidad de los 
dates para poder tener una idea mas precisa de su comportamiento. 
Para comprender mejor lo anterior consideremos el caso de dos 
alumnos que obtuvieron las siguientes calificaciones en un semestre: 
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Alumno 1: 


7 7^99 


Alumno 2: 


6 7 8 9 10 


En ambos casos la media aritmetica y la mediana son iguales a 
8. Sin embargo, las calificaciones del segundo alumno son mas 
variables que las del primero (ver figura 9). Asi que a pesar de 
que ambos tuvieron el mismo promedio, en terminos estadisticos 
ambos conjuntos de datos no tienen el mismo comportamiento. 


I I 
6 



alumno 1 


10 


o o i 

^ o o 

Till! 1 

6 7 ^ 

r 1 T III 1 

5 9 10 


alumno 2 


Figura 9. Dos conjuntos de datos con igual centro pero diferente variabilidad. 

Entonces, en el analisis de datos es importante conocer el centro 
de un conjunto de datos, pero tambien se requiere conocer que tan 
lejos del centro se encuentran los datos. En los siguientes parrafos 
abordaremos diferentes medidas que nos permitiran evaluar la 
variabilidad en los datos. 

Rango. La medida de variabilidad mas sencilla que existe es el rango. 
Representa la distancia entre el dato mas pequeno y el mas grande 
del conjunto. Esto es: 

Rango = dato mayor - dato menor 
Los datos que se muestran a continuacion representan los niveles 
maximos de monoxido de carbono en la zona noroeste del Area 
Metropolitana de la Ciudad de Mexico en la primera semana del 
mes de febrero de 2003 (Fuente: Centro de Control de la Red 
Automatica de Monitoreo Atmosferico). 

16 24 24 42 25 42 36 

< - Rango -► 

Rango = 24 - 16 = 26 

Observese que el rango depende solo de los datos extremos, por 
lo que resulta muy sensible a datos atipicos. Ademas no considera 
al centro de los datos, que debe ser la referenda respecto a la cual 
se mide la variabilidad. Debido a ello tiene poca utilidad. Ejemplos 
de sus aplicaciones pueden ser cuando se reportan temperaturas 
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maximas y minimas, indices maximos y minimos de contaminacion 
o en cartas de control de calidad de un producto, donde se reportan 
los extremes de la variable que se esta midiendo durente un periodo. 
En todos los cases anteriores el range proporciona una vision global 
de la variabilidad. 

Desviacion estandar y varianza 

La desviacion estandar es la medida de variabilidad mas conocida y 
utilizada. Nos proporciona un valor tipico que nos describe que tan 
lejos se encuentran los dates de la media aritmetica. Un elemento 
clave para entender la desviacion estandar es el de desviacion. 
Entenderemos por desviacion la distancia de un date respecto a la 
media. En un conjunto existen muchos dates, por lo tanto tendremos 
para cada uno de ellos una desviacion. 

La desviacion de un date respecto a la media se representa de la 
siguiente manera: 


desviacion = x - x 


Donde: 

x: Es un date del conjunto 

x: Es la media aritmetica del conjunto de dates 

De la expresion anterior se deriva que la desviacion puede ser 
negative o positive, dependiendo si el date es menor o mayor a la 
media aritmetica. Para mostrar lo anterior consideremos una grafica 
de puntos con los dates de la contaminacion por ozone utilizados en 
el calculo del rango: 


6.1 


> 


- 13.85 


- 4.9 




o 


T I 

25 30 


15 


20 


35 


40 


Ozono 


Figura 10. Diagrama de puntos con la media de los datos y algunas desviaciones. 
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En la seccion anterior senalamos que la media aritmetica constituia 
el punto de balance o equilibrio de un conjunto de dates. Ahora que 
introducimos el termino de desviacion, podemos ver que ello implica 
que la suma de las desviaciones de /os dates respecto a la media es 
igual a cero. Esta es sin duda una importante propiedad de la media. 
Simbolicamente se expresa de la siguiente manera: 


i=l 


— x) = 0 


Si calculamos las desviaciones para los puntajes de ozono, veremos 
que se cumple lo anterior. 


Puntajes de 
ozono 

Media 

Desviaciones 

16 

29.85 

16-29.85=-13.85 

24 

29.85 

24-29.85=-5.85 

24 

29.85 

24-29.85=-5.85 

42 

29.85 

42-29.85 = 12.15 

25 

29.85 

25-29.85=-4.85 

42 

29.85 

42-29.85 = 12.15 

36 

29.85 

36-29.85 = 6.15 



^ Desviaciones = 0 


En la busqueda de una expresion para calcular la desviacion estandar 
de un conjunto de dates, introduciremos el concepto de desviacion 
cuadratica, el cual consiste en elevar al cuadrado las desviaciones. 
Ahora todas las desviaciones seran positivas. Esto es: 

n 

= (-13.85)== + (-5.85)= + (-5.85)= + (12.15)= + (-4.85)= + (12.15)= + (6.15)= 


^(jTi - j:)= = 616.85 

i=l 

El resultado anterior representa la suma de las desviaciones 
cuadraticas de todos los dates. Si dividimos dicho resultado 
entre el total de dates, estaremos calculando el promedio de 
las desviaciones cuadraticas. A este resultado se le denomina 
varianza, y es otra medida de variabilidad de los dates. 
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^27 

■_ 

A 


/=! 

n 


^ = 88.1 
7 


Entonces, la varianza viene siendo el promedio (media aritmetica) 
de las desviaciones cuadraticas de un conjunto de dates. 

Si extraemos la raiz cuadrada al resultado anterior, se tendra el 
promedio (media aritmetica) de las desviaciones. A dicho resultado 
se le conoce como desviacion estandar. 


-xf 

\ -=9.39 

n 

A partir de un conjunto de dates hemos explicado el proceso que 
se sigue para calcular la varianza y la desviacion estandar. Ahora 
es necesario definir su simbologia, para lo cual haremos dos 
distinciones importantes: 
a) Cuando los dates provienen de una poblacion: 

La desviacion estandar se representa mediante la letra a y se 
expresa de la siguiente manera: 

N 


Por su parte, la varianza, que es el cuadrado de la desviacion 
estandar, se expresa: 

=-tl- 

N 

b) Cuando los dates provienen de una muestra: 

La desviacion estandar se representa mediante la letra S y la 
varianza mediante S^, respectivamente. 


s= 



8''=^ - 

n-\ 
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Observaciones: 


• jj. es\a media de la poblacion. 

• Y es la media de la muestra. 

• n es el total de datos en la muestra. 

• iV es el total de datos en la poblacion. 

• En el caso de la muestra el denominador es n - 1 en el lugar de n. 

La razon de dividir entre n-1 y no entre n en el caso de la muestra, 
es porque se ha determinado que de esta manera se puede estimar 
con mayor precision la media de una poblacion en situaciones de 
inferencia estadistica. 


ACTIVIDADES Y PROBLEMAS 

1. Observa la tabla y el diagrama que se presentan a la derecha y 
responde lo que se pide en cada inciso. 

GOBIERNO Y POLITICA 


DATOS GENERALES | 

CONCERTO 

2000 1 

Entidades federativas 

32 

Municipos 

2,443 

Senadores 

128 

Diputados federales 

500 

Esrados gobernados por el PRI 

19 

Esrados gobernados por el PAN 

7 

Esrados gobernados por el PRD 

4 

Esrados gobernados por el coalicion 

2 

Ciudadanos en e! padron electoral ( millones ) 

59.58 

POBLACION GOBERNADA POR PARTIDO 
(AMBITO MUNICIPAL). 2000 (%) 

PAN PRI PRD 

OTROS 


35.81 I 44.42 | 17.32 | 2.^ 



35.81%| PAN 


I 44.42%| PRI 
I 17.32%! PRD 


2.45% OTROS 


Figura 11. Representacion de los datos de Gobierno y politica. 
Fuente: Aguayo, S., 2000, El Almanaque Mexicano, Grijalbo, Mexico. 
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a) iCual es el titulo general del cuadro? 


b) iCual es el titulo del diagrama? 


c) iQue tipo de variable se mide? 


d) iQue representan los numeros dados en porcentajes en el 
diagrama de sectores? 


e) Redacta dos enunciados en los que expreses una opinion sugerida 
por los datos del diagrama. 


f) iCual es la fuente? 


2. Observa la siguiente tabla. Disena un diagrama de sectores. 
Determina cual es la variable independiente y cual la dependiente 

Parque vehicular, 1998 


Automoviles 

67.7% 

Camiones de carga 

31.5% 

Autobuses 

0.8% 


Fuente: Aguayo, 2000, El Almanaque Mexicano, Grijalbo, Mexico. 


3. Con los datos que se presentan en la tabla “Distribucion de casos 
de cancer en hombres y mujeres” disena un diagrama de barras para 
cada uno de los sexos. Antes responde las preguntas. 

a) iCual es la variable independiente para cada diagrama? 

b) iCual es la variable dependiente para cada diagrama? 

c) iPor que no es conveniente representar la informacion en diagramas 
de sectores? 
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DISTRIBUCION DE CASOS DE CANCER EN HOMBRE 

Y MUJERES.1995 _ 

MUJERES 


LUGAR LOCALIZACIDN CASOS % | 


1 

Cuello del utero 

15,749 

33.2 

2 

Mama 

7,791 

16 

3 

Ovario 

1,684 

3.5 

4 

Cuerpo del utero 

1,432 

3.0 

5 

Estomago 

1,258 

2.7 

6 

Glandula tiroides 

1,211 

2.6 

7 

Glandula linfaticos 

1,179 

2.5 

8 

Tejidos blandos 

1,080 

2.3 

9 

Vesicula biliar y vias intrahepaticas 

763 

1.6 

10 

Colon 

728 

1.5 


HOMBRES 


1 LUGAR LOCALIZACIEON 

CASOS 

% 1 

1 

Prostata 

3,674 

14.2 

2 

Estomago 

1,620 

6.3 

3 

Ganglios linfaticos 

1,566 

6.1 

4 

Tejidos blandos 

1,332 

5.2 

5 

Testiculos 

1,233 

4.8 

6 

Traquea, bronqueos y pulmon 

1,139 

4.7 

7 

Vejiga urinaria 

1,136 

4.7 

8 

Laringe 

842 

3.3 

9 

Encefalo 

702 

2.7 

10 

Rifion y otros organos urinarios 

660 

2.6 


Fuente; Registro Hispatologico de Neoplasias en Mexico, 1999. 

4. Observa el siguiente diagrama de barras. Indica dos aspectos 
en los que el diagrama puede ser mejorado, teniendo en cuenta 
las recomendaciones para elegir el tipo de grafica o diagrama 
que se dieron en el texto. 



Tierras deterioradas a nivel mundial y por regiones, 1945 - 1990. 

(Porcentaje de tierras fertiles que sufrieron degradacion grave o moderada). 

Fuente: Emily T. Smith y otros, Growth vs. Environment. The push for sustainable 
development, International Business Week/International Soil Reference & Information 
Centre, mayo 1992. 
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5. Los dates de la siguiente tabla corresponden a la presion sangumea 
sistolica de 278 hombres adultos saludables. 


a) Determina los intervales de clase y redefine los intervales de 
manera que se cubra la recta. 

b) Disena el histograma correspondiente. 


Presion sangumea 

Frecuencia 

100-104 

2 

105-109 

6 

110-114 

13 

115-119 

25 

120-124 

31 

125-129 

47 

130-134 

53 

135-139 

42 

140-144 

30 

145-149 

17 

150-154 

8 

155-159 

4 


c) Traza su poligono de frecuencia. 

6. Considera las calificaciones de los siguientes dos alumnos: 
Alumno 1: 7 7 9 x = Q 


Alumno 2: 


6 7 8 9 10 x = 8 
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a) Por simple inspeccion: icual de los dos conjuntos de dates tiene 
mayor variabilidad? 


b) Calculen la desviacion estandar y verifique que coincide con su 
respuesta al inciso anterior. 


1 



ctg'^a+l = 


sin^ a 


= cosec“a 


^ f'(x)= lim 


f(x+Ax) —f() 


■? 2 

os 2a = cos ■ a — sm a 


X-^0 


Ax 


n ^ a + cos ^ a = 1 


log^, b = -log 
sinx = a; x = (-1)2 arcsina+ Tcn, 


arctg(-a) = -arctga 
oga b'^ = rlog„^ 

clg 


ll) X - CO 



giogi-c _^iogh3 2cos^ a = I + cos 2a „ r» 

, ^ log^.b ^ ^.a + p.a—p 

cosa-cosP = -:^f'"^ ^ 


2„ sina-sinB=2sin’—^^cos- 

CX 2 ■> 


2 sin a 


tgx = a) X = uTctgu 




Sin 


^ 2 ^ 2 

l^inx+cosx)* = l + sin2x 


= 7 p{p-a)-(p/W(p-c) = p-r 

71 

_ . Ct + P IX-P 

=, "imn-l-j-iss-1- 


(= 2.HJn-=-cos- 

1 ■) 


2 COS 


a-i , . log, b 

s- - iog„b = -- 

2 '°gc a 


l-i;nx(H • Mb mcsija-.ii =-iimkiini 


f r(*-j) 


>yatiwnU> 


ig(a - 13 ) = ^ 

f '*'* cosa-ciis|) = 

.Ig-O . I=—V- = 

sin' nt ,_ 


j>y .<■ = -Bwwa-* r 
i... 


- nil 


.ij* ■ _ .('« 




?l> 


= l _ n.-> I. V... . V , , , I 

„ ^ . (x-i-i . </- h 

cos a - cos p = -2 SIn- - sin- - 

.. .. 7 7 


Uiii X +xU'sk)' = 14*1112x 


coNxI =(-rsjn2x 


la = 


2tga 


Sa =Vp(p-ii)-(p-b)-(p-c) = p-i 


I - tg"a 


- ,igx = a; x=arctga + nn 

7 cos 2a = 1- 2 sin “a • n Ot — p 

~a sina+sinP = 2sio ^-cos—^ 


























2. ESTUDIOS EDUCATIVOS SOBRE 
GRAFICAS, CENTROS Y DISPERSION 


El analisis de dates se apoya fuertemente en las representaciones 
graficas debido a que los dates cuantitatives desplegades en ferma 
visual penen en evidencia algunas de sus caracteristicas relevantes, 
que ne pueden ser percibidas si sole se observe la lista de dates o si 
se revisan los dates uno a uno. Esta potencia de las representaciones 
graficas es muy util para la comunicacion en nuestra sociedad 
altamente tecnificada. Sin embargo, la lecture e interpretacion 
adecuada de la informacion presentada en graficas y la eleccion y 
elaboracion de graficas para mostrar informacion contenida en los 
dates no son habilidades que se adquieran espontaneamente, sine 
que es necesario que seen objeto de la ensefianza. 

ESTUDIOS SOBRE GRAFICAS ESTADISTICAS 

Diferentes niveles de lectura de dates 

Un componente importante en el que ban avanzado las investigaciones 
en didactica de la estadistica es en la identificacion de diferentes 
niveles de lectura de los dates representados en tablas o graficas. 
Por ejempio, Curcio (1987) describe cuatro niveles distintos de 
lectura, de los cuales cada uno requiere mayor comprension que sus 
antecesores. 

1. El primer nivel es el de leer los dates-, el lector logra identificar 
los dates individuales del conjunto y con ello puede 
responder las siguientes dos preguntas: iEI date x pertenece 
a la grafica? iCual es la frecuencia del date x? 

2. El segundo nivel es el de leer entre los dates-, el lector percibe 
relaciones relevantes entre los dates que le permiten 
responder preguntas como: iCual es el valor mmimo? iCual 
es el maximo? iQue date tiene mayor frecuencia? Este 
nivel incluye comparar e incluso identificar en la grafica 
valores como la moda, la mediana y la media. Aunque de 
mayor dificultad, la estimacion de las medidas de dispersion 
tambien estan en este nivel. 

3. El tercer nivel es el de leer mas alia de los dates-, el lector 
realiza predicciones e inferencias a partir de los datos sobre 
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informacion que no se reflejan directamente en la grafica. 
Por ejempio, ique forma, media y/o dispersion tendra la 
distribucion de la poblacion? Si se obtiene un nuevo dato, 
ies razonable pensar que pertenece al mismo conjunto 
(distribucion)? 

4. El cuarto nivel es el de leer detrds de /os dates-, un lector 
en este nivel, ademas de hacer inferencias o predicciones, 
tambien puede valorar la calidad de una grafica y la validez y 
fiabilidad de losdatos que representa. iLafuente es confiable? 
iSe pueden verificar las caracteristicas del muestreo? iEI 
muestreo fue apropiado para el tipo de estudio? 

El aprendizaje de la lectura de graficas se debe distribuir a lo largo de 
la educacion preuniversitaria, y en el bachillerato el objetivo debiera 
ser que los estudiantes alcancen los niveles 3 y 4. 

Dificultades y errores comunes en la elaboracion de graficas 

a) Dificultades en la formacion de una distribucion de frecuencias 
Los resultados de muchas investigaciones en las que se observa 
una variable cuantitativa de alguna poblacion, en primera instancia, 
se representan en una lista de datos. Para graficarlos es necesario 
formar una distribucion con ellos, es decir, identificar cada valor y 
SU frecuencia. Una vez hecho lo anterior, se representan en el eje 
horizontal los diferentes valores de la variable y en el eje vertical 
sus frecuencias respectivas. Esta manera de proceder no es facil de 
realizar, como se muestra en Arteaga, Batanero, Ortiz y Contreras 
(2011), quienes hallaron que mas de 25% de una poblacion de 
207 futures profesores fue incapaz de elaborar la distribucion y 
graficarla. 

Un error comun que refleja la dificultad para formar la distribucion 
de una lista de datos es la de considerar la pareja (orden de aparicion, 
magnitud del numero). Por ejempio, se asigna la siguiente tarea: 
lira 10 veces un par de dados y suma los resultados. Anotalos en 
una lista y graficalos. 

Los estudiantes que ignoran como formar la distribucion, ante un 
conjunto de datos como el que se muestra, hacen la grafica de la 
figura 11a, en lugar de la grafica de la figura 11b. 

Por ejempio, si se obtiene la lista de datos: 3, 5, 7, 6, 4, 7, 8, 3, 5,5. 
La grafica de la izquierda no es correcta, pero es comun. La grafica 
de la derecha es la grafica de la distribucion. 
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Suma (b) 


Figura 12. (a) Ejemplo incorrecto para graficar datos; (b) Forma correcta de graficar 
los datos del ejemplo. 

b) Dificultades para definir las escalas o divisiones de los ejes 
Los errores relacionados con las escalas, aunque pueden provenir 
del desconocimiento de convenciones acerca de la elaboracion de 
las graficas, tambien provienen de deficiencias en los antecedentes 
matematicos que se requieren. Li y Shen (1992) encontraron que 
varios de sus estudiantes elegian una escala inadecuada para mostrar 
aspectos relevantes del conjunto de datos, o bien, que no alcanzaba 
a cubrir el campo de variacion de la variable representada. Otros 
omitian las escalas en alguno de los ejes, horizontal o vertical (o en 
ambos), y muchos no especificaban el origen de las coordenadas. 
Hay otros que utilizan escalas no homogeneas. 

Detras de algunas de las anteriores dificultades se encuentra la 
tendencia a no ver en el eje X una recta numerica, sino solo un 
espacio para indicar los valores que se presentan en los datos, como 
si fueran etiquetas. 

ESTUDIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL 

Se suelen llamar medidas de tendencia central a la moda, la media 
y la mediana. Las definiciones matematicas de estos conceptos se 
dieron en el capitulo 1 de este libro. Ahora revisaremos algunos 
aspectos que ban surgido en las investigaciones sobre este tema. La 
mayoria de los estudios didacticos realizados a la fecha se enfocan 
en la nocion de media y, por esta razon, en esta seccion se comenta 
mas extensamente este concepto que los otros dos. 

La media aritmetica de un conjunto de datos numericos es un 
concepto engahoso, pues su definicion es muy simple: la suma de 
datos entre el numero de datos del conjunto. Aunque en algunas 
situaciones los estudiantes pueden tener algunas dificultades en 
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calculos relacionados con la media; por ejempio, para calcularla 
a partir de dates agrupados o en problemas que suelen llamarse 
de media ponderada, en realidad, las verdaderas dificultades son 
conceptuales; es decir, cuando se trata de interpretarla, de atribuirle 
un significado apropiado, o de utilizarla en las diversas situaciones 
en las que su uso es pertinente. 

Batanero (2000) menciona cuatro significados que suelen asociarse 
a la media aritmetica, pero que no suelen ser bien entendidos por 
los estudiantes, de manera que no los utilizan en las situaciones 
en las que podrian ser utiles. Tales significados se agrupan en los 
siguientes cuatro rubros: 

• Distribucion equitativa de cantidades dispares. 

• Estimacion de una cantidad desconocida en presencia de 
errores de medida. 

• El valor con mayor probabilidad al tomar un elemento al azar 
de una poblacion. 

• Representante de un conjunto de datos. 

A continuacion se precisa en que consiste cada uno de ellos a traves 
de ejemplos. 

Distribucion equitativa de cantidades dispares 

En muchas situaciones en las que se tienen datos que varian uno del 
otro, se desea simplificar la situacion pensando que pasaria si no 
hubiera dicha variacion; este es un mecanismo del pensamiento que 
lo potencia. Por ejempio, sabemos que la produccion de petroleo 
en el pais es variable; no obstante, se ofrecen noticias como la 
siguiente: 

Produce Pemex 2 millones 562 mil barriles de petroleo diarios 
en enero. 01 de marzo de 2013. Boletin No. 28 

Se entiende que algunos dias de enero se produciran mas de 2.56 
millones, otros menos; de hecho, quiza los domingos no se produzca 
ninguno. Pero lo que uno entiende es que los 2.56 millones son un 
promedio. Este valor es accesible al pensamiento y a la memoria y 
es facilmente comunicable, comparado con una tabla formada por 
la lista de la produccion de cada uno de los 30 dias de enero. 

A pesar de que este significado es muy utilizado en la practica y 
pareciera que no se presta a confusion, se ha encontrado que en 
ciertos contextos los estudiantes no lo interpretan adecuadamente. 
Por ejempio, se les pregunto a estudiantes de secundaria lo siguiente: 
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Un estudio encontro que los estudiantes de escuelas primarias 
ven en promedio 3 horas diarias de television. 

a) iQue significa en promedio “3 horas de TV diarias” en este 
enunciado? 

b) icomo crees que se obtuvo este promedio? 

Algunas de las respuestas al inciso a, son: 

• Los nihos ven la TV aproximadamente tres horas diarias. 

• La mayoria de nihos ve la TV tres horas diarias. 

Ninguna de ellas es adecuada; la primera porque podria haber 
algunos nihos que vean la TV cero horas, otros 10 horas diarias y el 
promedio podria ser 3; en este caso no se puede decir que 0 y 10 son 
aproximadamente 3. La segunda respuesta tampoco es adecuada 
porque podria no haber ningun niho que vea la TV las 3 horas diarias 
y, no obstante, obtenerse el promedio de 3. 

Con referenciaal inciso bde la situaci6nplanteadaarriba,tambien hay 
respuestas que no coinciden con lo que supone es la normatividad: 

• Se observe que un niho veia la TV tres horas diarias. 

• Se observaron muchos nihos y se vio que veian la TV 
alrededor de 3 horas. 

• Se vio que la mayoria de los nihos veian la TV 3 horas diarias. 
Las anteriores comprensiones inadecuadas sobre la media provienen 
del uso informal de este concepto sin hacer las precisiones necesarias 
relacionadas con la definicion tecnica y sus propiedades. 

Otras interpretaciones encontradas en nihos mas pequehos para 
la media se presentan en Watson y Moritz (2000). Estos autores 
estudian la forma en que los nihos de diferentes edades comprenden 
el concepto de "promedio" y el uso que hacen de este en situaciones 
de la vida diaria. Realizaron entrevistas con alumnos de tercero de 
secundaria en las que plantean preguntas como las siguientes: “iHas 
escuchado la palabra promedio? iQue significa para ti?” “En promedio, 
las familias australianas tienen 2.3 nihos. Explica que significa para 
ti esta frase”. “Supongamos que 10 familias tienen en promedio 2.3 
nihos. Entre ellas, la familia Grant tiene 4 y la familia Cooper tiene 1, 
icuantos hijos podrian tener las restantes 8 familias?”. Con base en 
las respuestas recibidas, identificaron seis niveles de comprension 
de los promedios: 

1. Nivel pre-promedio: los nihos no usan ningun termino de 
promedio y solo imaginan historias con cierta relacion con 
el contexto de la pregunta. 
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2. Uso coloquial de un promedio utilizan terminos como "es 
normal o es okey". Imaginan ideas relacionadas al contexto 
para apoyar sus respuestas; por ejempio, en relacion con la 
pregunta responden historias como “Que tienen dos ninos 
grandes y otro que no ha crecido todavi'a’’, “el .2 es un niho 
que tiene 2 ahos ahora y cuando cumpla 10, contara como 1 
y entonces el numero promedio de ninos sera 3”. 

3. Estructura multiple del promedio, manejan dos o mas ideas 
como el mds comun, el de en medio y, en ocasiones, el 
algoritmo al describir un promedio. 

4. Representacion con promedio se refieren directamente al 
algoritmo de la media en relacion con las situaciones. Ademas 
son conscientes de que la forma decimal de una media es 
consecuencia del algoritmo y expresan alguna idea sobre la 
naturaleza de la media como representante de un conjunto. 

5. Los estudiantes ademas son capacesdeaplicarsuconocimiento 
de la media a situaciones complejas, como completar un 
conjunto de valores para obtener una media dada o calcular 
una media ponderada, pero no ambas. 

6. Hacen todo lo anterior incluyendo las dos ultimas tareas 
mencionadas. 

Varias de las dificultades que se observan en los estudios con 
ninos pequenos se vuelven a encontrar ligeramente distintos en 
estudiantes de bachillerato e incluso universitarios. Por ejempio, 
Mayen (2009) hizo un estudio con alumnos de secundaria y 
bachillerato en Mexico tomando preguntas de investigaciones 
anteriores. Solo 52% de los estudiantes de secundaria y 80% 
de los de bachillerato respondio correctamente a la siguiente 
situacion “Un periodico dice que 2.2 es el numero medio de hijos 
por familia en Mexico. Explica que significa para ti esta frase". Al 
pedirles un ejempio concreto de distribucion de 10 familias para 
obtener un numero medio de 2.2 hijos, el numero de respuestas 
correctas en estudiantes de bachillerato bajo a 56%. 

Aunque la interpretacion de la media como distribucion equitativa 
de cantidades dispares es la mas cercana al algoritmo, en el sentido 
de que se deduce de las operaciones aritmeticas que se realizan para 
calcularla, no esta exenta de dificultades. La siguiente interpretacion 
presenta mayor grado de dificultad. 

Estimacion de una cantidad desconocida, en presencia de errores 
de medida. 

En la teoria de errores de medidas fisicas la media juega un papel 
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importante y de gran utilidad. En efecto, cuando en un trabajo 
experimental se realizan varias mediciones de una magnitud fisica, 
en general, no se obtiene el mismo resultado. Surge entonces el 
problema de cual es la mejor aproximacion a la verdadera medida 
de la magnitud en cuestion. La teoria de los errores establece que la 
mejor aproximacion es la media aritmetica cuando las mediciones 
cumplen las siguientes caracteristicas: 

• Cada medicion es independiente de cualquier otra. 

• Se pueden cometer errores con la misma frecuencia, tanto 
por defecto como por exceso. 

La media aritmetica se aproximara tanto mas al valor verdadero 
de la magnitud cuanto mayor sea el numero de medidas, ya que 
globalmente los errores aleatorios se compensan. Este uso de 
la media de un conjunto de medidas de un objeto como la mejor 
estimacion de la medida real del objeto no es una idea que surja 
espontaneamente en los estudiantes, y aunque el profesor lo 
mencione en su clase, ellos suelen no utilizarla para resolver 
problemas relacionados. Para comprobarlo, basta hacer preguntas 
como la siguiente: 

Un objeto pequenofuepesadoseparadamente por nueve estudiantes 
en una clase de ciencias, utilizando la misma escala. Los pesos (en 
gramos) anotados por cada uno de ellos se muestran a continuacion. 

6.1 6.0 6.0 5.9 6.4 6.3 6.0 6.2 

Los estudiantes quieren determinartan acertadamente como sea 
posible el peso real de este objeto. iQue valor les propondrias? 

Muchos estudiantes tenderan a elegir 6.0 “porque es el que mas se 
repite”, otros diran que cualquiera podria servir, algunos proponen 
el punto medio del rango; muy pocos propondran la media, que de 
acuerdo con la teoria de errores seria la mejor estimacion. Si los 
alumnos son los que obtienen los pesos, optan por el valor de “quien 
tomo el peso con mas cuidado”, lo que hace intervenir apreciaciones 
subjetivas. 

Como se vera mas adelante, los problemas significativos en los que 
se debe aplicar la media se dan en contextos que requieren de otras 
consideraciones; por ejempio, de la dispersion de los datos. Con 
base en ellas el analista no aplica rigidamente la regia; por ejempio, 
la siguiente modificacion transforma el problema anterior: 




42 


ELEMENTOS DE ESTADISTICA Y SU 
DIDACTICA A NIVEL BACHILLERATO 


Unobjetopequenofuepesadoseparadamentepornueveestudiantes 
en una clase de ciencias, utilizando la misma escala. Los pesos (en 
gramos) anotados por cada uno de ellos se muestran a continuacion. 

6.1 6.0 6.0 15.9 6.4 6.3 6.3 6.0 6.2 

Los estudiantes quieren determinartan acertadamente como sea 
posible el peso real de este objeto. iQue valor les propondrias? 


La media en este problema es: 7.24, que seria muy probablemente 
una mala estimacion ocasionada por el valor atipico 15.9. El analista 
supone que este valor es espurio, debido a un error diferente a 
los errores de medida esperados; entonces puede optar por dos 
posibilidades: 1) Excluir el valor atipico y obtener la media del resto 
de los datos: 6.13; 2) elegir la mediana: 6.2. 

La amplia aplicacion de la estadistica al analisis de diferentes tipos 
de medidas experimentales es uno de los motivos por los que se 
imparten cursos de Estadistica en las carreras cientificas. Para 
explotar su potencial, el estudiante debe aprender a interpretar 
los diferentes conceptos y procedimientos estadisticos de manera 
adecuada y flexible; uno de estos es la media, que aunque parezca 
muy simple, encierra ideas profundas que el estudiante debe 
asimilar. La siguiente interpretacion es otro ejemplo. 

El valor con mayor probabilidad al tomar un elemento al azar de 
una poblacion. 

La relacion de la media con los fenomenos aleatorios a veces no es 
tan Clara porque la media se presenta en estadistica descriptiva 
de una manera y en probabilidad de otra, a saber, como el valor 
esperado. Para ver dicha relacion conviene referir la situacion de 
muestreo simple que menciona Batanero (2000), en la que se eligen 
elementos de una poblacion numerica cuya media es conocida: 


La altura media de los alumnos de un colegio es 1.40 m. Si 
extraemos una muestra aleatoria de 5 estudiantes y resulta 
que la altura de los 4 primeros es de 1.38 m, 1.42 m, 1.60 m y 
1.40 m. iCual seria la altura mas probable del quinto estudiante? 
(Batanero, 2000). 


El error mas frecuente en el problema anterior consiste en buscar 
el valor para el que la muestra tenga una media de 1.40 m, en este 
caso: 1.20 m. Este surge de la creencia de los estudiantes de que la 
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solucion debe encontrarse mediante un procedimiento matematico 
precise; la solucion correcta, que es 1.40m, no se obtiene mediante 
procedimiento alguno, si no que se basa en la comprension de lo que 
es una media en una distribucion. 

Como hemos mencionado, las interpretaciones dependen decondiciones 
particulares del contexto. En el caso anterior, se utiliza el hecho 
(conocido, pero no explicito en el enunciado) de que la distribucion 
de las alturas tiene una forma aproximadamente normal (en forma 
de campana y simetrica respecto a su media), de manera que la 
media coincide con el valor mas probable. 

Batanero (2000), al destacar este significado o interpretacion de la 
media, ofrece algunos ejemplos comunes en estadistica: 

Por ejempio, al predecir la esperanza de vida o el beneficio esperado 
en una inversion en bolsa, se toma la media de la variable en la 
poblacion como prediccion, como valor esperado. por sus propiedades 
muestrales derivadas del teorema central del li'mite. Del concepto de 
valor esperado se derivan muchos modelos de prediccion, como los 
distintos tipos de regresion. Asi, cuando predecimos el peso de una 
persona en funcion de su altura, usamos el peso promedio de todas las 
personas que en la poblacion tienen la altura (p. 4). 

Estos comentarios son validos, pues las variables de la que provienen 
los datos tienen distribuciones normales. 

Representante de un conjunto de datos 

Este significado de la media se utiliza muy a menudo, pero es de gran 
dificultad para los estudiantes. El ejempio clasico es el promedio 
de calificaciones como representante o resumen de las diferentes 
calificaciones obtenidas por un estudiante en las asignaturas del 
programa escolar. En este contexto familiar todo mundo entiende la 
funcion de la media (o promedio) como representante del conjunto 
de calificaciones, pero cuando se formulan problemas en otros 
contextos, esta interpretacion no surge de manera espontanea y 
natural. Por ejempio, en el siguiente problema de comparacion de 
datos: 
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1. En la tabla de abajo se presentan las estaturas en metros de 10 
hombres holandeses: 

1.87 1.71 1.75 1.83 1.85 1.92 1.92 1.86 1.70 1.88 

a) iCual es la estatura de los hombres en Holanda? 

b) iQue valor o numero consideraste como representante de las 
alturas de los holandeses? 

2. En la tabla de abajo se presentan las estaturas en metros de 
ocho hombres mexicanos: 

1.74 1.71 1.96 1.80 1.76 1.72 1.68 1.62 

a) iCual es la estatura de los hombres en Mexico? 

b) iQue valor o numero consideraste como representante de las 
alturas de los mexicanos? 

3. iCuantos centimetros son mas altos los holandeses que los 

mexicanos?_ 

4. Reunanse con otros companeros y comenten sus respuestas. 
Cada quien argumente sus propuestas y lleguen a un acuerdo 
sobre las respuestas correctas. En caso de duda consulten con su 
profesor (Sanchez, et al., 2012). 


En un estudio de Orta (2009) con estudiantes de secundaria, encontro 
que responden espontaneamente de formas muy variadas a las 
preguntas, pero solo 5% utiliza la media aritmetica en sus respuestas. 
Los problemas de comparacion de grupos de datos o de distribuciones 
son muy apropiados para que los estudiantes aprendan a utilizar 
la media como un recurso para resolverlos y, con ello, incorporar 
dicho significado a su formacion estadistica. En la siguiente seccion, 
referente a la dispersion de los datos, volveremos a este punto. 

ESTUDIOS SOBRE DISPERSION 

Hace relativamente poco tiempo, Shaughnessy (1997) senalo 
que hasta esa fecha no habia habido investigaciones didacticas que 
estudiaran las dificultades, concepciones, problemas y formas 
de ensenar el concepto de variacion estadistica. Mostro como los 
investigadores en educacion estadistica habian estado 
mas interesados en el concepto de media. Esta escasa o nula 
investigacion sobre la variacion, que se puso de relieve en ese entonces. 
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contrasta con la opinion general de los estadisticos acerca de 
que la variacion es el corazon de la estadistica (Moore; 1998). A 
partir de entonces se han hecho importantes estudios que plantean 
preguntas acerca del aprendizaje de la variacion. 

La dispersion es un sinonimo de variacion cuando esta se refiere a 
un conjunto de datos numericos. Las medidas de dispersion mas 
comunes son el rango, la desviacion media, la desviacion estandar 
y los cuartiles (o mas en general, los percentiles). En la ensenanza 
el tratamiento de estos conceptos ha consistido, al igual que con el 
concepto de media, en buscar que los estudiantes se aprendan la 
formula para calcularlas, bajo el supuesto de que esto puede permitir 
SU interpretacion y uso en las situaciones- problema en las que este 
concepto es util. Nada mas alejado de la realidad. 

A continuacion se presentan algunas ideas basicas sobre el riesgo 
basadas en la exposicion de Fischhoff y Kadvany (2011). 

En particular, para los fines de este libro basta mencionar algunas 
ideas de tres temas que abordan estos autores: la definicion de 
riesgo, el analisis del riesgo y la toma de decisiones en situaciones 
de riesgo. El riesgo se presenta cuando hay potenciales resultados 
no deseados que pueden traer como consecuencia perdidas o 
dahos. Definir el riesgo significa especificar los resultados valiosos y 
los no deseados en un orden que refleje el valor que se les atribuye. 
En muchas ocasiones, se pueden medir los resultados no deseados o 
valiosos; por ejempio, las tasas de mortalidad o el producto interne 
bruto. Tambien hay eventos en los que no hay acuerdo de como 
medirlos: pobreza, bienestar o sustentabilidad. Finalmente, hay 
algunos en que la sola idea de medirlos es controversial, asi son las 
amenazas a la justicia o los dahos ecologicos a la naturaleza. 

Una vez que se identifican los riesgos, el problema es determinar que tan 
grandes o prejudiciales son y cuales son las posibles causas que los 
gobiernan. El analisis del riesgo generalmente son constructos 
intrincados, a menudo integran los analisis de cientificos de diferentes 
areas del conocimiento y toman en cuenta una diversidad de 
f uentes de datos o informacion. No obstante, hay una variedad tan amplia 
defenomenos, que la logica del analisis del riesgo puede consistir en 
simples conteos de datos, con cuyos resultados se puedan llevar a 
cabo conocidos analisis estadisticos, hasta complejas simulaciones 
de modelos ciberneticos que contengan informacion cientifica de 
areas especializadas ademas, de procesos estocasticos complejos. 
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El analisis del riesgo ofrece informacion para la toma de decisiones. 
La teoria de la toma de decisiones en situaciones de riesgo tiene dos 
aspectos; por un lado, define reglas abstractas sobre lo que deberia 
hacer la gente en situaciones de riesgo; por otro, estudia lo que hace 
la gente cuando se enfrenta realmente a tales situaciones: “Si la gente 
no sigue las reglas, quiere decir que o las personas necesitan ayuda o 
las reglas necesitan una revision” (Fischhoff y Kadvany, 2011, p. 65). 

En los casos en que el analisis del riesgo ofrece un conjunto ordenado 
de posibles resultados, la regia para tomar decisiones es simple: 
“elija la opcion cuyo resultado produzca algo con la mayor cantidad 
del valor que usted desea tener (dinero, descanso, acres de tierras 
humedas, etc.)” (Fischhoff y Kadvany, 2011, p. 65). La ordenacion de 
los resultados generalmente contiene incertidumbre y esta asociada 
a distribuciones de probabilidad. Entonces la regia debe combinar el 
valor deseado que proporciona cada resultado con la probabilidad 
de que ocurra para cada posible decision. 

Un problema en el contexto de juegos 

No iremos mas alia de los comentarios anteriores, pues son suficientes 
para indicar la naturaleza del contexto de riesgo en el problema que 
se propone a continuacion. Al analizar el problema de debe aclarar 
el papel de la media y la dispersion para la toma de decisiones en la 
situacion de riesgo que se propone. 

En una feria se invita a los asistentes a participar en uno de dos 
juegos. Juan puede participar en un juego, pero no en ambos. Para 
saber por cual decidirse observa, anota y ordena los resultados de 
dos muestras de 10 personas que ban participado en cada juego. 
Las perdidas (-) o premios (+) en efectivo que ban obtenido las 20 
personas se muestran en las siguientes listas: 

Juego 1 

15 -21 -4 50 -2 11 13 -25 16 -4 

Juego 2 

120 -120 60 -24 -21 133 -81 96 -132 18 

5i tienes la posibilidad de participar en un solo juego iCual juego 
elegirias? Explica las razones de tu respuesta. 

Una respuesta relativamente aceptable es que es igual jugar en 
cualquiera de los dos juegos, esto con base en el argumento de que 
ambos conjuntos tienen la misma media (p = 4.9), es decir, a la larga 
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en cualquiera de los juegos se ganara en promedio 4.9 unidades. 
No obstante, una respuesta mas avanzada debe tener en cuenta la 
dispersion. Es notorio que en los datos del segundo juego hay mucha 
mas dispersion que en los del primero (figura 13). En este contexto, 
la dispersion se asocia al riesgo: el juego 2 es mas arriesgado, pues 
aunque con base en los datos se puede conjeturar que es posible 
ganar cantidades mayores que en el juego 1 (el maximo en el juego 
2 es 133, mientras que en el juego 1 es 50) tambien es posible perder 
mas (el minimo en el juego 2 es -132, mientras que en el juego 1 
es -25). La decision depende de las preferencias y condiciones 
economicas del jugador, si es propenso al riesgo y tiene suficientes 
recursos para jugar, podria optar por el juego 2; si es conservador o 
no tiene suficientes recursos, le conviene elegir el juego 1. 


Problema 2 



Figura 13. Grafica del problema de riesgo. 

Analisis del problema. La idea del problema es propiciar que 
el estudiante se ubique en una situacion de riesgo, de manera 
que se de cuenta que la eleccion de un juego u otro conlleva 
consecuencias en terminos de beneficios-perdidas. El primer 
paso en el analisis es preguntarse en que juego se gana mas 
dinero globalmente; esta pregunta se la hacen los estudiantes de 
manera natural, pero la respuesta que ofrecen es muy variada. 
Nuevamente pensar en la ganancia promedio de cada juego (media 
aritmetica de los datos) y compararlas es una idea que pocos, si 
alguno, la consideran; la mayoria omiten este paso que es crucial 
para el analisis. Sus comparaciones suelen ser resultado de una 
impresion de riesgo que les producen los datos individuales de la 
distribucion: unos comparan los maximos de las distribuciones 
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y hacen afirmaciones como “en el juego 2 se gana mas”, otros 
comparan los minimos “en el juego 1 se pierde menos”; otros 
podrian ignorar la cantidad precisa que se gana o se pierde y solo 
cuentan cuantos perdedores (cantidades negativas) y cuantos 
ganadores (cantidades positivas) tiene cada juego, decidiendo que 
da lo mismo escoger uno u otro. 

Una vez que se determina con base en la ganancia promedio que 
los dos juegos son equivalentes, se debe formular la pregunta ien 
cual juego se corre mas riesgo? Inferir que el juego con mayor 
dispersion es mas arriesgado que el juego con menor dispersion 
ofrece un significado pertinente a la teoria del riesgo. El problema 
de valorar el riesgo consiste en ponderar que mientras en el juego 
con mayor dispersion se puede tener la fortuna de ganar mas que 
en el otro, pero tambien se corre el riesgo de perder mas. En el 
juego con menor riesgo se puede ganar menos que en el primero, 
pero tambien se puede perder menos. No hay una regia general 
que indique cual es la mejor decision, pues depende de la situacion 
economica particular del jugador, asi como de sus creencias y 
actitudes ante el riesgo. 

Una dificultad que suelen encontrar los estudiantes surge de la falta 
de informacion acerca de la naturaleza del juego y sobre la manera 
particular en que un jugador gana determinada cantidad. Muchos 
estudiantes llenan este vacio imaginando situaciones: unos pueden 
pensar en una urna con bolas numeradas, otros en juegos de caballos, 
etc. Encontramos que algunos estudiantes imaginan que el primer 
dato del primer juego (15) corresponde a un jugador y que el 
primer dato del segundo juego corresponde a su oponente (120) y 
concluyen que el jugador del segundo juego le gano al primero (por 
105). Situaciones en las que se pueden coleccionar datos ignorando 
el modelo subyacente son frecuentes en la investigacion estadistica. 
La idea del problema es propiciar que el estudiante realice un estricto 
analisis de los datos interpretando la situacion a pesar de dichas 
restricciones. El siguiente ejempio es tambien de una situacion de 
riesgo y en el es mas clara la ausencia de un modelo para explicar el 
comportamiento de los datos. 
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Un problema en el contexto de salud-enfermedad 

Ejempio de problema es situaciones de riesgo. 

Considera que debes aconsejar a una persona que padece una 
enfermedad grave, incurable y mortal, pero que es tratable con 
medicamentos que pueden extender la vida por varios anos mas. 
Es posible elegir entre tres tratamientos. Las personas tienen 
diferentes reacciones a las medicinas, para algunas tienen el 
resultado previsto, mientras que para otras pueden ser mas 
beneficas o mas prejudiciales. En las siguientes listas se muestran 
los anos que ban vivido varios pacientes que se ban tratado con una 
de las opciones mencionadas; cada dato de las listas corresponde 
al tiempo que ba sobrevivido un paciente con el respective 
tratamiento. Despues se muestran las graficas correspondientes 
a los tratamientos. 

Tiempo en anos (tratamiento 1) 

5.2 5.6 6.5 6.5 7.0 7.0 7.0 7.8 8.7 9.1 
Tiempo en anos (tratamiento 2) 

6.8 6.9 6.9 7.0 7.0 7.0 7.1 7.1 7.2 7.4 
Tiempo en anos (tratamiento 3) 

6.8 6.8 6.9 7.0 7.0 7.1 7.1 7.1 7.2 7.4 
iQue tratamiento recomendarias? iPor que? 


El primer paso en el analisis de este problema, al igual que los 
anteriores, es calcular el tiempo medio de vida para cada tratamiento 
(p = 7.04). Con base en esta informacion se podriadecirque cualquier 
tratamiento es igual; no obstante, en la medida en que lo que esta 
en juego es de suma importancia, parece imprescindible bacer un 
analisis (de riesgo) mas detenido. Claramente el tratamiento 1 tiene 
mayor dispersion (figura 14) y, por lo tanto, ofrece mas riesgo, 
en el sentido mismo del problema anterior: los datos indican que se 
puede vivir mas que el tiempo que indican los datos en cualquiera de 
los otros dos tratamientos (9.1 > 7.4), pero tambien se puede vivir 
menos(5.2 < 6.8).iCuales ladecisionadecuadaentreelegirel primer 
tratamiento y cualquiera de los otros dos? Nuevamente, no bay una 
regia general que prescriba la mejor eleccion, aunque en este caso 
una decision conservadora podria ser mas popular que una decision 
arriesgada. Decidir entre el tratamiento 2 y el 3 es mas dificil, pero 
si el criterio de menor riesgo se ba tornado y este se asocia con la 
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desviacion estandar muestral, los dates del tratamiento 2 indican 
menor dispersion (S^ = 0.17, S 3 = 0.18), aunque la diferencia es tan 
pequena que se pueden considerar equivalentes. 

Analisis del problema. El analisis de este problema es muy similar 
al anterior sobre la eleccion entre dos juegos. El primer paso es 
comparar las medias, despues considerar con cuidado la dispersion. 
Como se ha indicado, este sencillo procedimiento no suele estar 
dentro de las estrategias espontaneas de los estudiantes y bien 
puede ocurrir que hayan entendido que en el contexto de perdida- 
ganancia es conveniente comparar las medias de los conjuntos 
de datos y no transferirlo a las situaciones de tiempo de vida en 
contextos de salud-enfermedad. Con relacion al analisis de la 
dispersion, es frecuente que un mismo alumno sea propenso al 
riesgo en el caso de juegos de perdida-ganancia de dinero, y sea 
adverse al riesgo en el caso de salud-enfermedad o viceversa. Lo 
importante de la consideracion del riesgo es que lo interpreten 
de manera adecuada y no caigan en el error de creer que “mayor 
dispersion significa mayor tiempo de vida”, pues esto es falso. 


Tiempo de vida 


Tratamiento 1 


Qj Tratamiento 2 
D 
U 
01 


Tratamiento 3 



Figura 14. Grafica de los datos del problema del tiempo de vida. 

Conclusion. Se ban propuesto tres problemas que pueden ser 
utiles para disenar lecciones de estadistica para desarrollar el 
razonamiento estadistico de los estudiantes en los temas de media 
y dispersion. Las razones para hacerlo son variadas: la importancia 
de que el profesor cuente con problemas para cubrir los contenidos 
curriculares, las dificultades detectadas en el tema en cuestion y la 
necesidad de darles un significado que sea accesible a los alumnos. 
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Los problemas se han adaptado al formato de comparacion de 
conjuntos de dates, pues prefiguran problemas de inferencia, 
atraen el interes de los estudiantes, no son triviales y su solucion 
requiere de los instrumentos elementales de la estadistica. 
Tambien se han inscrito en los contextos de mediciones repetidas 
(ya senalado por Batanero, 2000) y de riesgo, pues ambos ofrecen 
oportunidades para enriquecer el significado de las nociones de 
media y dispersion. La intencion es explorar recursos que permitan 
ir mas alia de las interpretaciones de la media y la dispersion que 
se constrinen a contextos puramente matematicos. Se han hecho 
algunas recomendaciones para implementarlos en clase, acordes 
con el espiritu actual de las recomendaciones curriculares: dejar a 
los estudiantes que propongan soluciones, promover la discusion y 
prever los errores y falsas concepciones que ya han sido detectadas 
en la investigacion. En el future, investigaciones empiricas y 
practicas escolares podrian proporcionar evidencias de las ventajas 
y desventajas del uso de este tipo de problemas en clase. 
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3. ESTRATEGIAS PARA LA 
ENSENANZA DE LA ESTADISTICA 


La investigacion en educacion estadistica ha desarrollado propuestas 
para transformar la ensehanza de la materia y ofrecer mayores 
probabilidades de que los estudiantes desarrollen competencias 
estadisticas. En este capitulo se expondran tales estrategias y los 
argumentos que las justifican. 

EL CONCERTO DE COMPETENCIAS 

Existe un descontento generalizado por los logros que se obtienen 
de la educacion matematica. Y no solo porque haya bajos indices de 
aprobacion en la materia, sino porque aun los estudiantes que 
acreditan con altas notas los cursos de matematicas no saben 
utilizar adecuadamente sus conocimientos en los contextos de su 
vida personal o profesional donde las matematicas serian utiles. 
En estos casos se habla de un conocimiento enciclopedico y no un 
conocimiento funcional. 

En estadistica, por ejempio, hay quienes aprenden a leer y construir 
graficas en el salon de clase, pero no saben ni quieren leer o 
interpretar las graficas periodisticas o del INEGI; tampoco se les 
ocurre que una grafica podria contribuir al analisis y comunicacion 
de resultados en sus actividades profesionales. 
iQue son las competencias? 

Conviene revisar algunas definiciones del concepto competencia 
para formarse una idea del nucleo comun que comparten. Para 
Perrenoud (2002), “una competencia es una capacidad para movilizar 
diversos recursos cognitivos para hacer frente a un tipo de 
situaciones”. Las personas tienen recursos cognitivos variados, se 
dice que son competentes si saben ponerlos en accion y los movilizan 
para realizar las tareas derivadas de las situaciones que enfrentan. 
Una definicion mas conocida es la que se formula en el proyecto 
Tunning (Beneitone et al., 2007): “El concepto de competencia se 
entiende como una combinacion dinamica de atributos, en relacion 
con conocimientos, habilidades, actitudes y responsabilidades. 
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que describen los resultados de los aprendizajes de un programa 
educative o lo que los estudiantes son capaces de demostrar al final 
del proceso educative”. 

Las competencias se ubican en la relacion entre conocimiento y 
accion, entre teoria y practica. De lo que se trata es de que en la 
educacion se asuma el compromise de formar ciudadanos capaces 
de utilizar sus conocimientos en la solucion de los problemas que 
encontraran en su vida personal, social y laboral. Aunque nunca se 
ha dicho que la educacion persiga lo contrario, en realidad se ha 
asumido que la adquisicion de conocimientos es una condicion previa 
para su aplicacion y que la escuela se encarga de proporcionarlos. Se 
supone que una base solida en este sentido servira para aplicartales 
conocimientos en la vida personal, social y laboral/profesional. Pero 
estos supuestos, aparentemente validos, los cuestiona una realidad 
en la que la gente aprende a actuar al margen de los conocimientos 
adquiridos. Peor aun, cuando intentan ponerlos en juego no saben 
como hacerlo o lo hacen de manera deficiente o equivocada. 

La competencia matematica 

Dado que hay una estrecha relacion entre la matematica y la 
estadistica, conviene entonces repasar algunas formulaciones que 
aclaran lo que significa la competencia matematica. En el proyecto 
PISA se define como “capacidad de un individuo para identificar 
y comprender el papel que las matematicas juegan en el mundo, 
realizar razonamientos bien fundados y utilizar e involucrarse en 
las matematicas de manera que satisfagan las necesidades de la 
vida del individuo como ciudadano constructivo, comprometido y 
reflexivo” (INCE 2004, p. 12) [PISA]. 

En esta declaracion se subrayan los aspectos que diferencian a 
la propuesta de la educacion por competencias de otras, como 
la de resolucion de problemas o la guiada por el constructivismo. 
Esto es, se enfatiza en la relacion de la matematica con el mundo 
(aplicaciones) y en su utilidad en la vida del individuo. Parece mentira 
que la sencillez y especificidad de esta declaracion origine serias 
discusiones, ya que en ningun curricula o programa de estudios se 
ha pretendido que lo que se ensefie y aprenda el estudiante de las 
matematicas en la escuela no le sirva mayormente su vida. Pero en los 
hechos, en muchos casos, la utilidad que obtienen en la ensefianza 
tradicional de las matematicas se reduce a no reprobar la materia 
y a librar el obstaculo que representa para realizar el proyecto 
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de obtener un titulo profesional; despues de esto dificilmente se 
acuerdan de lo aprendido en esta materia. 

Algunos investigadores que analizan y promueven el curriculo 
por competencias consideran que cuando se habla de la utilidad 
de la matematica en la vida del individuo se corre el peligro de 
enfocarlo desde un punto de vista estrecho, que puede llevar a 
pensar en la “matematica de la tiendita”, es decir, en la aritmetica 
elemental que se necesita para saber cuanto se tiene que pagar en el 
mercado. Para evitar esta connotacion o reduccionismo proponen 
el concepto de “contextos o situaciones socialmente relevantes” 
en las cuales el conocimiento matematico es significativo. Desarrollar 
una competencia matematica seria entonces ser capaz de utilizar el 
conocimiento matematico en las situaciones socialmente relevantes. 
Hay que notar, que para la matematica en general, no hay consenso 
acerca de cuales son tales situaciones socialmente relevantes y que 
la elaboracion de un curriculo por competencias deberia partir de 
SU constitucion. Pero el caso de la estadistica es diferente, pues en 
esta disciplina estan muy bien definidas, de tal manera que se puede 
hablar de competencias estadisticas. 

Relaciones entre la matematica y la estadistica 
Para entender el papel de la estadistica en el curriculo por competencias, 
conviene tener en cuenta cual es la discusion acerca de la relacion 
entrelaestadisticay la matematica. Varies estadisticosyeducadores 
estadisticos defienden que la estadistica no es una rama de las 
matematicas, ni siquiera dentro de las matematicas aplicadas. La 
estadistica tiene caracteristicas propias que conviene tener en 
cuenta para entender mejor las propuestas de como ensenarla. 
Entre las diferencias fundamentales se encuentran: 

a) La consideracion de los dates, los cuales en estadistica, a 
diferencia de las matematicas, no se pueden separar del 
contexto del que provienen. 

b) La importancia de la recoleccion de dates, asi como las 
circunstancias en las que se Neva a cabo. 

c) La centralidad de la variabilidad. 

d) La presencia de la incertidumbre en sus resultados. 

Esta discusion sobre si la estadistica es o no parte de las matematicas 
se resuelve si se enfoca la ensenanza de las matematicas desde un 



58 


ELEMENTOS DE ESTADISTICA Y SU 
DIDACTICA A NIVEL BACHILLERATO 


curriculo por competencias. Pues se puede pensar que la estadistica 
proporciona situaciones socialmente relevantes en las que se utilizan 
las matematicas. Esto quiere decir, las situaciones de la estadistica 
son apropiadas para desarrollar competencias matematicas. De esta 
manera se debe considerar entonces que la nocion de competencia 
estadistica esta relacionada con las competencias matematicas. 

El concepto de competencia estadistica 
Se define mediante los siguientes puntos: 

a) Poseer y saber utilizar los conocimientos basicos de la 
estadistica. 

b) La habilidad para interpretar y evaluar criticamente la 
informacion estadistica, argumentos relacionados con los 
datos o con fenomenos estocasticos. 

c) La habilidad para discutir y comunicar sus reacciones a tal 
informacion estadistica, tal como comprender el significado 
de la informacion y sus implicaciones. 

d) La actitud de formular preguntas que puedan responderse 
mediante la recoleccion y analisis de datos. 

e) Las destrezas para disenar y llevar a cabo investigaciones 
estadisticas. 

La estadistica es naturalmente multidisciplinar, en el sentido 
de que su campo de accion se sobrepone con otras disciplinas. 
La definicion de Moore (1998) es relevante en este sentido, 
pues “la estadistica es un metodo intelectual general que se 
aplica dondequiera que haya datos, variacion y azar. Es un 
metodo fundamental porque los datos, la variacion y el azar son 
omnipresentes en la vida moderna” (p. 134). Para Cobb y Moore 
(2000), “la estadistica es una disciplina metodologica. Ella existe 
no por si misma sino para ofrecer a otros campos de estudio 
un conjunto coherente de ideas y herramientas para tratar con 
datos. La necesidad de una disciplina como esta, surge de la 
omnipresencia de la variabilidad”. Sin duda, estas caracteristicas 
de la estadistica son favorables para el enfoque por competencias. 
Un punto de referencia importante para definir las competencias 
acerca de cualquier disciplina es observar lo que hacen los expertos 
en esa disciplina. En el caso de la estadistica. Wild y Pfannkuch 
(1999) hicieron una investigacion sobre como piensan y actuan 
los estadisticos cuando trabajan en su profesion. De ese estudio 
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formularon un modelo del pensamiento estadistico, que se expone 
en la siguiente seccion. 

El modelo de pensamiento estadistico de Wild y Pfannkuch (1999) 

El modelo tiene cuatro dimensiones (ver figura 14), las cuales organizan 
el conjunto de aspectos que pone en juego un estadistico cuando 
resuelve problemas estadisticos. El primero es el cicio investigative 
(Dimension 1), formado por los cinco pasos (PPDAC = Problema, 
Plan, Dates, Analisis, Conclusiones), problema que se ponen en 
juego al desarrollar uno: el interes y la habilidad de formular un 
problema susceptible de responderse con datos; el diseno de un plan 
para obtener los datos; la obtencion o recogida de datos llevando a 
cabo dicho plan; el analisis de los datos y obtencion de conclusiones. 
Para resolver un problema el estadistico profesional sabe que debe 
desarrollar un cicio investigative; cuando lo desarrolla pone en practice 
ciertos esquemas de pensamiento que lo guian, los cuales constituyen 
los tipos fundamentales de pensamiento (Dimension 2) y son: 

a) La necesidad de los datos. El matematico enfrenta muchos de 
sus problemas mediante la reflexion y la representacion 
de sus ideas en el papel; en contraste, el estadistico sabe 
que para resolver un problema requiere datos. 

b) la transnumeracion. Consiste en las diversas 
transformaciones a que se someten los datos, la realizacion 
de diversos tipos de graficas y el calculo de numeros 
resumenes (media, moda o variancia; rango, desviacion 
media, desviacion estandar) para tratar de revelar la historia 
que cuentan los datos. 

c) Consideracion de la variacion. La busqueda de patrones de 
variacion en los datos, asi como su descripcion, explicacion 
o control, de acuerdo con el tipo de problema y el contexto 
al que pertenecen los datos. 

d) Razonamiento con modelos. Consiste en aplicar las 
herramientas estadisticas al problema y situacion de la 
que provienen los datos. Estas herramientas son las que 
se proporcionan en los cursos tradicionales de estadistica: 
distribuciones, muestreo, intervalos de confianza, pruebas 
de hipotesis y analisis de variancia. 

e) Integracion de lo estadistico y el contexto. 
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Dimension 1: Cicio investigative PPDAC 

Dimension 2: Tipos fundamentales del 
pensamiento estadi'stico 
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Figura 15. Dimensiones del modelo del pensamiento estadi'stico 
(Wild y Pfannkuch 1999). 


El cicio interrogativo se refiere a los procesos de produccion y 
examen de ideas con relacion al problema en una situacion dada; 
estos consisten en la generacion de ideas, busqueda de claves e 
indicios en los datos, interpretacion de patrones o irregularidades, 
critica de los diferentes aspectos del proceso, para finalmente, 
emitir juicios sobre la calidad y potencia del proceso y sus resultados. 
Finalmente, las disposiciones tienen que ver con las actitudes 
frente al trabajo estadistico y profesional. Estas dimensiones, asi 
como sus contenidos, constituyen una informacion fundamental 
para el diseno de un curricula que contenga entre sus objetivos 
la formacion de competencias estadisticas y para el profesor que 
asume la responsabilidad de promoverlas. 

Las dimensiones del pensamiento estadistico estan en un nivel 
superior al contenido estadistico, pues orientan acerca de como 
utilizarlo de una manera provechosa en la resolucion de problemas. 
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Entre las caracteristicas del modelo anterior y las unidades de 
contenido especifico que suelen encontrarse en los curriculos se 
localizan las ideas (estadisticas) fundamentales. 

Las ideas estadisticas fundamentales 

Un curriculo basado en competencias debiera privilegiar las situaciones 
socialmente relevantes sobre contenidos especificos, esto implica 
renunciar a incluir en el curriculo el catalogo tradicional de los 
contenidos. Diaz-Barriga (2012) opina: ... hay que entender que 
no se ha logrado superar del todo al curriculo enciclopedista, tan 
denostado en el discurso educative de la innovacion debido a que se 
encuentra cargado de contenidos factuales” (p. 31). 

Sin embargo, llevar a cabo una reduccion radical de contenidos a 
favor de un enfoque por competencias es una decision dificil de 
tomar y de realizar en la practica. iComo ensenar estadistica si 
no se sigue la secuencia de la estadistica descriptiva de comenzar 
con graficas y seguir con medidas de tendencia central, medidas de 
variacion y, finalmente, con regresion y correlacion? 

Si los contenidos del catalogo ban pasado la prueba del tiempo 
y se ban mantenido en la opinion favorable de los cientificos, los 
elaboradores de curriculo, los profesores y los padres de familia, 
icomo elegir unos contenidos por sobre otros? O, icomo explicar su 
posibleausenciaen el curriculo? Este es un problema dificil de resolver, 
al menos en el curriculo de las matematicas. Por ejempio, omitir 
en este algunos contenidos, como numeros primos o polinomios, 
bajo la justificacion de que no son relevantes en la vida social de las 
personas, seria una afrenta para la comunidad de los matematicos 
y los educadores matematicos. En cambio, en la investigacion en 
educacion estadistica se ha avanzado en proporcionar (ya sea de 
manera consciente o no) una salida a esta problematica, la cual 
ha consistido en definir ideas (estadisticas) fundamentales para 
organizar el curriculo, estas pueden ser desarrolladas apoyandose 
en contenidos especificos, pero sin imponer la necesidad de cubrirlos 
todos, ni en un orden definido. Los investigadores en educacion 
estadistica Burril y Bielher (2011) propusieron las ideas o nociones 
siguientes: 


• Datos. Los ladrillos con los que se construyen conocimientos 
derivadosdelanalisisestadisticosonlosdatos.Losproblemas 
en los que la estadistica presta ayuda son aquellos en los 
cuales se pueden coleccionar y analizar datos. 

• \/ar/ac/6n. La variabilidad esta presente encualquierfenomeno 
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y la estadistica identifica, describe, mide, explica y/o predice 
dicha variabilidad. A la descripcion o medida de la variabilidad 
se le llama variacion. 

• Distribucion. Una distribucion es el instrumento matematico 
idoneo para describir un conjunto de dates y permitir a los 
estadisticos observar y analizar la variacion presente en 
ellos. Una distribucion teorica es la descripcion de un patron 
de variacion de una variable aleatoria. 

• Representacion. Los diagramas y representaciones graficas 
permiten descubrir y destacar diferentes angulos de 
los dates y sus distribuciones gracias a que permiten su 
visualizacion. La potencia de las representaciones se expresa 
cuando son utilizadas en el analisis, y no solo come vehiculos 
de comunicacion. 

• Asociacion y correlacion. Establecer relaciones entre variables 
es un objetivo que suele presentarse en todas las disciplinas 
cientificas y la estadistica aporta los instrumentos para 
analizar los distintos grades de asociacion o correlacion que 
pueden presentarse entre variables estocasticas (categoricas 
o numericas). 

• Probabilidad. En la caracterizacion de Moore de la estadistica, 
este menciona tres elementos: dates, variacion y azar; estos 
ultimos se modelan a traves de la probabilidad. En cualquier 
resultado de la estadistica se presenta incertidumbre que se 
describe y mide mediante modelos probabilisticos. 

• Muestreo e inferencia. La posibilidad de hacer afirmaciones 
con cierto grade de certeza acerca de una poblacion con 
base en el analisis de una muestra es un objetivo fundamental 
de la estadistica. Los instrumentos derivados de las ideas 
anteriores se articulan para llevar a cabo este proposito. 

La presencia de estas ideas en el curricula no es suficiente para 
pensarlo como dirigido hacia el desarrollo de competencias, pues se 
puede constatar que en gran medida tales ideas ya ban estado en 
el curricula tradicional; sin embargo, si ofrecen una orientacion para 
reducir la lista de contenidos usualmente presentes en el curriculo. 
En sintesis, la estructura del curriculo tradicional no es la apropiada 
para el desarrollo de competencias, pero tampoco un nuevo 
curriculo podria ser un catalogo reducido que contuviera ahora solo 
las ideas fundamentales. Sin embargo, si se tienen en cuenta y se 
agrega la propuesta de enfocar la ensenanza de la estadistica hacia 
la realizacion de investigaciones y/o proyectos, entonces se podria 
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ir configurando la forma de un nuevo curriculo. Un intento serio en 
este sentido se encuentra en el marco curricular para la educacion 
estadistica de Franklin et al. (2005). 

Un marco curricular para la educacion estadistica 
Franklin et al. (2005) proponen un marco conceptual para la educacion 
estadistica de niveles preuniversitarios, el cual tiene por objetivo 
ultimo propiciar el desarrollo de la competencia estadistica: “nuestras 
vidas estan gobernadas por numeros. Cualquier estudiante egresado 
del bachillerato debe ser capaz de usar el razonamiento estadistico 
para enfrentarse de manera inteligente con los requerimientos de 
la ciudadania, el empleo y la familia, y estar preparado para una 
vida productiva saludable y feliz” (p. 1). Estos autores manifiestan 
que el marco que proponen es un complemento de las sugerencias 
curriculares que sobre el tema de analisis de datos y probabilidad 
presentan los Principios y Estandares de la NCTM (NCTM 2000). 
En SU propuesta se enfatiza la diferencia entre matematicas y 
estadistica, y se senala a la variabilidad y al papel del contexto como 
factores que reflejan esa diferencia. 

El marco mencionado esta organizado en torno a dos nociones 
centrales: 1) la solucion de problemas estadisticos; y 2) el papel de la 
variabilidad en los procesos de solucion de problemas estadisticos. 
Los procesos de solucion de problemas estadisticos involucran 
cuatro componentes: 

1. La formulacion de una pregunta. 

2. La recoleccion de datos. 

3. El analisis de los datos. 

4. La interpretacion de los resultados. 

Los autores sugieren que en cada uno de estos cuatro componentes 
debe intervenir la variabilidad. Por ejempio, al hacer una pregunta 
conviene anticiparla. Mientras que en la recoleccion de datos se 
debe reconocer el papel crucial que representa, de tal manera 
que en algunos casos convendra propiciarla, y en otros tratar de 
reducirla. En el analisis se intentara explicar la variabilidad en los 
datos; y, finalmente, en la interpretacion se incluira a la variabilidad 
como un elemento presente de diversas formas. 


El marco conceptual de Franklin et al. (2005) orienta sobre como 
organizar los procesos de solucion en las situaciones- problema 
que se consideren socialmente relevantes, y no pone en primer 
piano los contenidos que tradicionalmente ban sido especificos de 
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la disciplina. Su orientacion indica el desarrollo de un pensamiento 
estadistico como objetivo transversal. 


LA PROPUESTA DE ENSENANZA MEDI ANTE PROYECTOS ESTADISTICOS 

La importancia de investigaciones y proyectos estadfsticos 

Como ya se ha mencionado, la ensenanza de la estadistica a traves de 
proyectos (Diaz et al., 2008; MacGillivray y Pereira-Mendoza, 2011) 
se propone desarrollar el pensamiento estadistico, y la comunidad de 
educadores estadfsticos ban propuesto metodologias de ensenanza 
a tono con un curriculo basado en el desarrollo de competencias. Esta 
propuesta presupone que la adquisicion de contenidos especificos 
clave en la disciplina se realizara en el contexto de una investigacion, 
lo que permitira que el estudiante les asigne un sentido, se de cuenta 
de su importancia y pueda utilizarlos en el desarrollo de otros 
proyectos. La ensenanza de la estadistica a traves de proyectos 
esta basada en la instrumentacion del marco curricular de Franklin 
et al. (2005). El caracter transversal de la propuesta consiste en 
que un proyecto de investigacion estadistica pueda realizarse de 
manera significativa y valiosa en el contexto de cualquier contenido 
disciplinar. Adicionalmente, esta metodologia tambien es propicia 
para desarrollar otras competencias, como lo sugieren Diaz y 
colaboradores (2008). 

Un proyecto para la ensenanza es una investigacion en la que se 
trata de responder una pregunta mediante la recogida y analisis de 
datos dentro de las posibilidades que tienen los alumnos del grado 
correspondiente. Una condicion para saber si una pregunta es 
adecuada es cuestionarse si genera un proceso investigative: 

1. La formulacion de una pregunta. 

2. La recoleccion de datos. 

3. El analisis de los datos. 

4. La interpretacion de los resultados. 

La pregunta debe contar con las siguientes condiciones: 

a) La pregunta o problema deben ser de interes. 

b) Los datos deben ser accesibles. 

c) Los conceptos, tecnicas y razonamientos que genera deber 
estar al nivel de los estudiantes. 
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La pregunta o problema deben ser de interes. Muchas preguntas 
se pueden responder con datos, pero pueden carecer de interes. Es 
cierto que un tema puede interesar a algunos estudiantes y a otros 
no, y pocos pueden ser los temas que a todos les interesen. Por eso 
conviene, al formular una pregunta, responder tambien esta: ipor 
que es importante responderla? Motivando el interes de quienes en 
principio no les es atractivo. Otro aspecto que se debe cuidar es la 
concrecion. Al respecto, Batanero y Diaz comentan: 

La fase de planteamiento de preguntas es una de las mas difi'ciles. Los 
alumnos rara vez comienzan con un problema claramente formulado. 
Generalmente podn'an comenzar sin preguntas claramente definidas y 
el papel del profesor es ayudarles a pasar de un tema general (deportes) 
a una pregunta que pueda contestarse (en la pasada temporada, ,;los 
equipos de futbol que jugaron en su propio campo, lo hicieron mejor 
que los que jugaron en campo contrario? Batanero y Diaz, (2011). 

Los datos deben ser accesibles. Los datos de un proyecto pueden ser 
recogidos por los propios estudiantes mediante una encuesta o la 
observacion de algun fenomeno, o tambien pueden ser obtenidos 
de bases de datos. Hay muchas bases de datos de instituciones 
confiables como la Unesco. Por ejempio, una tarea importante que 
debiera ser parte del curso de Estadistica es conocer y explorar la 
pagina del INEGI (http://www.inegi.org. mx/) de manera que los 
estudiantes aprendan sobre los temas que hay en ella y los datos 
que ahi se pueden encontrar. 

Los conceptos, tecnicas y razonamientos deben estar al nivel de los 
estudiantes. El aspecto mas dificil es el de prever que el tipo de 
conceptos, tecnicas y razonamiento estadisticos del proyecto 
elegido este al alcance del estudiante. Se recomienda la formula 
que se plantea en la propuesta de resolucion de problemas: el 
problema no debe ser tan facil que se resuelva mediante rutina, 
ni tan dificil que sea imposible resolverlo por el estudiante. Lo que 
hay que evitar es que el objetivo final sea aprender la tecnica o el 
razonamiento, debe tenerse en cuenta que el objetivo debe ser 
decir algo acerca de la situacion de la cual provienen los datos y 
para eso se requieren ciertos conceptos, tecnicas y razonamientos. 
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TEMAS DE PROYECTOS 

Conviene que el profesor tenga una lista de posibles proyectos a 
desarrollar por los estudiantes, haga un analisis de los conceptos, 
tecnicas y razonamientos que implique, que pruebe la accesibilidad 
de los dates y la viabilidad para ser realizados en clase. Por ejempio, 
los siguientes dan una idea de alguno de ellos; sin embargo, para las 
condiciones especificas de cada aula se pueden determinar muchos 
otros: 

• iExiste discriminacion laboral respecto a la mujer? 

• iQue posicion (economica, demografica, politica o social) 
tiene Mexico en America Latina? 

• iTiene ventaja el equipo de futbol que juega en su propio 
campo? 

En el siguiente capitulo se presenta el desarrollo complete de 
un proyecto que proponen Batanero, Diaz y Gea (2012), dicho 
proyecto ilustra una manera diferente de concebir la ensenanza de 
la estadistica. 
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4. LAS ESTADISTICAS DE 
POBREZA Y DESIGUALDAD^ 


Objetivos 

Se trata de analizar una serie de variables demograficas, entender su 
utilidad y el motive por el cual son recogidas, analizar las relaciones 
entre las diferentes variables y estudiar las diferencias en sus 
distribuciones entre paises, segun su nivel de desarrollo. 

Un objetivo importante es mostrar la utilidad de la estadistica en 
el estudio de interrelaciones entre variables. Los alumnos, 
alternativamente, podrian tomar otros ficheros de dates de 
Internet o de anuarios estadisticos y desarrollar proyectos sobre otros 
temas en diferentes areas de aplicacion. El analisis es descriptive, con 
finalidad exploratoria y no se plantean problemas de inferencia. 
Rouncenfield (1995) presenta este proyecto sobre el cual los 
alumnos pueden trabajar en grupos, comparando las variables 
en los diferentes grupos de paises y formulando por si mismos 
preguntas de su interes. Mostraremos algunos ejemplos de las 
posibles actividades a desarrollar con los estudiantes. 

Alumnos 

Este proyecto podria ser desarrollado con alumnos de bachillerato 
o en un primer curso de estadistica en la universidad. En este ultimo 
case, se podrian plantear preguntas de tipo inferencial, lo que 
requeriria el uso de procedimientos estadisticos mas avanzados. 

Los datos 

La actividad se desarrolla en torno a un proyecto a partir de un 
fichero que contiene datos de 97 paises y que ha sido adaptado del 
preparado por Rouncenfield (1995), quien uso como fuentes Day 
(1992) y Unesco (1990). Este fichero ha sido tornado de Journal 
of Statistical Education (www.amstat.org/publications/jse/). 
Contiene las siguientes variables, que se refieren a 1990: 

• Tasa de natalidad-. Ninos nacidos vivos en el aho por cada 
1000 habitantes; 

• Tqsq de mortalidad-. Numero de muertes en el aho por cada 
1000 habitantes; 


^ Carmen Batanero, Carmen Diaz y M. Magdalena Gea 
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• Mortalidad infantil-. Numero de muertes en el ano por cada 
1000 nines de menos de 1 ano; 

• Esperanza de vida al nacer para hombres y mujeres; 

• PNB: Producto Nacional Bruto per capita en dolares (EU); 

• Grupo: Clasificacion de paises en funcion de la zona geografica 
y situacion economica, en las siguientes categorias: 1 = Europa 
Oriental, 2 = Iberoamerica, 3 = Europa Occidental, America del 
Norte, Japon, Australia, Nueva Zelanda, 4 = Oriente Medio, 
5 = Asia, 6 = Africa. 

Memos anadido el numero de habitantes en 1990 en miles de 
personas (poblacion), tornado del anuario publicado por el periodico 
espanol El Pais. En la Tabla 2 listamos los datos del proyecto. 

Tabla 2. Fichero de datos del proyecto “Analisis demografico”. (cont/nua) 


Pais 

Grup 

0 

Tasa 

Natalidad 

Tasa 

Mortalida 

d 

Mortalidad 

Infantil 

Esperanza 
de vida 
hombre 

Esperanza 
de vida 
mujer 

PNB 

Poblacion 

(miles) 

Afganistan 

5 

40.4 

18.7 

181.6 

41.0 

42.0 

168 

16000 

Albania 

1 

24.7 

5.7 

30.8 

69.6 

75.5 

600 

3204 

Alemania Oeste 

3 

11.4 

11.2 

7.4 

71.8 

78.4 

22320 

16691 

Alemania Este 

1 

12.0 

12.4 

7.6 

69.8 

75.9 


61337 

Argelia 

6 

35.5 

8.3 

74.0 

61.6 

63.3 

2060 

24453 

Angola 

6 

47.2 

20.2 

137 

42.9 

46.1 

610 

9694 

Arabia Saudi 

4 

42.1 

7.6 

71.0 

61.7 

65.2 

7050 

13562 

Argentina 

2 

20.7 

8.4 

25.7 

65.5 

72.7 

2370 

31883 

Austria 

3 

14.9 

7.4 

8.0 

73.3 

79.6 

17000 

7598 

Bahrein 

4 

28.4 

3.8 

16.0 

66.8 

69.4 

6340 

459 

Bangladesh 

5 

42.2 

15.5 

119.0 

56.9 

56.0 

210 

111590 

Belgica 

3 

12.0 

10.6 

7.9 

70.0 

76.8 

15540 

9886 

Bielorusia 

1 

15.2 

9 

13.1 

66.4 

75.9 

1880 


Bolivia 

2 

46.6 

18.0 

111.0 

51.0 

55.4 

630 

7110 

Botswana 

6 

48.5 

11.6 

67.0 

52.3 

59.7 

2040 

1217 

Brasil 

2 

28.6 

7.9 

63.0 

62.3 

67.6 

2680 

147294 

Bulgaria 

1 

12.5 

11.9 

14.4 

68.3 

74.7 

2250 

9001 

Camboya 

5 

41.4 

16.6 

130.0 

47.0 

49.9 


8250 

Canada 

3 

14.5 

7.3 

7.2 

73.0 

79.8 

20470 

26302 

Colombia 

2 

27.4 

6.1 

40.0 

63.4 

69.2 

1260 

32335 

Congo 

6 

46.1 

14.6 

73.0 

50.1 

55.3 

1010 

2208 

Corea (Norte) 

5 

23.5 

18.1 

25.0 

66.2 

72.7 

400 

21143 

Checoslovaquia 

1 

13.4 

11.7 

11.3 

71.8 

77.7 

2980 

15641 

Chile 

2 

23.4 

5.8 

17.1 

68.1 

75.1 

1940 

12980 

China 

5 

21.2 

6.7 

32.0 

68.0 

70.9 

380 

1105067 

Dinamarca 

3 

12.4 

11.9 

7.5 

71.8 

77.7 

22080 

5132 

Ecuador 

2 

32.9 

7.4 

63.0 

63.4 

67.6 

980 

10329 

Egipto 

6 

38.8 

9.5 

49.4 

57.8 

60.3 

600 

51390 

Emirates 

Arabes 

4 

22.8 

3.8 

26.0 

68.6 

72.9 

19860 

1544 

Espaha 

3 

10.7 

8.2 

8.1 

72.5 

78.6 

11020 

39161 

Etiopia 

6 

48.6 

20.7 

137 

42.4 

45.6 

120 

48861 

Pilipinas 

5 

33.2 

7.7 

45.0 

62.5 

66.1 

730 

61224 

Finlandia 

3 

13.2 

10.1 

5.8 

70.7 

78.7 

26040 

4974 

Francia 

3 

13.6 

9.4 

7.4 

72.3 

80.5 

19490 

56119 

Gabon 

6 

39.4 

16.8 

103.0 

49.9 

53.2 

390 

1105 

Gambia 

6 

47.4 

21.4 

143.0 

41.4 

44.6 

260 

848 

Ghana 

6 

44.4 

13.1 

90.0 

52.2 

55.8 

390 

14425 

Grecia 

3 

10.1 

9.2 

11.0 

65.4 

74.0 

5990 

10039 

Guayana 

2 

28.3 

7.3 

56.0 

60.4 

66.1 

330 

95 

Holanda 

3 

13.2 

8.6 

7.10 

73.3 

79.9 

17320 

14828 

Hong Kong 

5 

11.7 

4.9 

6.10 

74.3 

80.1 

14210 

5735 

Hungria 

1 

11.6 

13.4 

14.8 

65.4 

73.8 

2780 

10587 

India 

5 

30.5 

10.2 

91.0 

52.5 

52.1 

350 

832535 

Indonesia 

5 

28.6 

9.4 

75.0 

58.5 

62.0 

570 

178211 

Iran 

4 

42.5 

11.5 

108.1 

55.8 

55.0 

2490 

50204 
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Tab la 2. Fichero de datos del proyecto “Analisis demografico”. (continuacion) 


Pais 

Grupo 

1 asa 

Natalidad 

1 asa 

Mortalidad 

Mortalidad 

Infantil 

Esperanza 
de vida 
hombre 

Esperanza 
de vida 
mujer 

PNB 

Poblacion 

(miles) 

Iraq 

4 

42.6 

7.8 

69.0 

63.0 

64.8 

3020 

18271 

Irlanda 

3 

15.1 

9.1 

7.5 

71.0 

76.7 

9550 

3537 

Israel 

4 

22.3 

6.3 

9.7 

73.9 

77.4 

10920 

4525 

Italia 

3 

9.7 

9.1 

8.8 

72.0 

78.6 

16830 

57537 

Japon 

3 

9.9 

6.7 

4.0 

75.9 

81.8 

25430 

123045 

Jordania 

4 

38.9 

6.4 

44.0 

64.2 

67.8 

1240 

4041 

Kenia 

6 

47.0 

11.3 

72.0 

56.5 

60.5 

370 

23277 

Kuwait 

4 

26.8 

2 

15.6 

71.2 

75.4 

16150 

2020 

Lfbano 

4 

31.7 

8.7 

48.0 

63.1 

67.0 


2900 

Libia 

6 

44.0 

9.4 

82.0 

59.1 

62.5 

5310 

4395 

Malasia 

5 

31.6 

5.6 

24.0 

67.5 

71.6 

2320 

17340 

Malawi 

6 

48.3 

25.0 

130.0 

38.1 

41.2 

200 

8230 

Marruecos 

6 

35.5 

9.8 

82.0 

59.1 

62.5 

960 

24567 

Mexico 

2 

29.0 

23.2 

43.0 

62.1 

66.0 

2490 

85440 

Mongolia 

5 

36.1 

8.8 

68.0 

60.0 

62.5 

110 

2128 

Mozambique 

6 

45.0 

18.5 

141 

44.9 

48.1 

80 

15357 

Namibia 

6 

44.0 

12.1 

135.0 

55.0 

57.5 

1030 

1300 

Nepal 

5 

39.6 

14.8 

128.0 

50.9 

48.1 

170 

18431 

Nigeria 

6 

48.5 

15.6 

105.0 

48.8 

52.2 

360 

113665 

Noruega 

3 

14.3 

10.7 

7.8 

67.2 

75.7 

23120 

4215 

Oman 

4 

45.6 

7.8 

40.0 

62.2 

65.8 

5220 

1486 

Pakistan 

5 

30.3 

8.1 

107.7 

59.0 

59.2 

380 

109950 

Paraguay 

2 

34.8 

6.6 

42.0 

64.4 

68.5 

1110 

4161 

Peru 

2 

32.9 

8.3 

109.9 

56.8 

66.5 

1160 

21142 

Polonia 

1 

14.3 

10.2 

16.0 

67.2 

75.7 

1690 

38061 

Portugal 

3 

11.9 

9.5 

13.1 

66.5 

72.4 

7600 

10333 

Rumania 

1 

13.6 

10.7 

26.9 

66.5 

72.4 

1640 

23148 

Sierra Leona 

6 

48.2 

23.4 

154.0 

39.4 

42.6 

240 

4040 

Singapur 

5 

17.8 

5.2 

7.5 

68.7 

74.0 

11160 

2664 

Somalia 

6 

50.1 

20.2 

132.0 

43.4 

46.6 

120 

6089 

Sri Lanka 

5 

21.3 

6.2 

19.4 

67.8 

71.7 

470 

16779 

Sudafrica 

6 

32.1 

9.9 

72.0 

57.5 

63.5 

2530 

34925 

Sudan 

6 

44.6 

15.8 

108.0 

48.6 

51.0 

480 

24423 

Suecia 

3 

14.5 

11.1 

5.6 

74.2 

80.0 

23660 

8485 

Suiza 

3 

12.5 

9.5 

7.1 

73.9 

80.0 

34064 

6541 

Suazilandia 

6 

46.8 

12.5 

118.0 

42.9 

49.5 

810 

761 

Tailandia 

5 

22.3 

7.7 

28.0 

63.8 

68.9 

1420 

55200 

Tanzania 

6 

50.5 

14.0 

106 

51.3 

54.7 

110 

25627 

Tunez 

6 

31.1 

7.3 

52.0 

64.9 

66.4 

1440 

7988 

Turqufa 

4 

29.2 

8.4 

76.0 

62.5 

65.8 

1630 

54899 

U.K. 

3 

13.6 

11.5 

8.4 

72.2 

77.9 

16100 

57270 

EU 

3 

16.7 

8.1 

9.1 

71.5 

78.3 

21790 

248243 

Ucrania 

1 

13.4 

11.6 

13.0 

66.4 

74.8 

1320 


Uganda 

6 

52.2 

15.6 

103.0 

49.9 

52.7 

220 

16722 

Uruguay 

2 

18.0 

9.6 

21.9 

68.4 

74.9 

2560 

3067 

URSS 

1 

17.7 

10.0 

23.0 

64.6 

74.0 

2242 

287664 

Venezuela 

2 

27.5 

4.4 

23.3 

66.7 

72.8 

2560 

19244 

Vietnam 

5 

31.8 

9.5 

64.0 

63.7 

67.9 


65758 

Yugoslavia 

1 

14.0 

9.0 

20.2 

68.6 

74.5 


23707 

Zaire 

6 

45.6 

14.2 

83.0 

50.3 

53.7 

220 

34442 

Zambia 

6 

51.1 

13.7 

80.0 

50.4 

52.5 

420 

7837 

Zimbabue 

6 

41.7 

10.3 

66.0 

56.5 

60.1 

640 

9567 


Preguntas, actividades y gestion de la clase 

La actividad inicial consiste en discutir el significado de las variables 
de este fichero y analizar como se ban calculado las diferentes tasas: 
natalidad, mortalidad, esperanza de vida, PNB. Los alumnos podrian 
investigar que otros indicadores alternativos se emplean para 
obtener un indicador demografico o economico de la riqueza de un 
pais. El profesor podria pedirles que busquen articulos en la prensa 
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en que se hable de alguno de estos indicadores y que expliquen con 
sus propias palabras la utilidad que pueden tener y que averiguen 
quien y como los calcula. 

1. iPodrias explicar que significa cada una de las variables del 
fichero? iQuien y como las calcula? iComo se recogen los 
datos? iHabria otro modo de calcular el indice de natalidad? 
iPara que sirve? iPodrias encontrar alguna noticia en la 
prensa relacionada con estas variables? 

Unpuntomuy importantees la discusionde las variables y el problema 
de la medicion. Es precise concienciar a los alumnos de la dificultad 
que reviste el proceso de categorizacion o de medicion, porque 
la realidad es siempre mas compleja que nuestros metodos para 
estudiarla. La toma de conciencia sobre la complejidad del proceso 
de elaboracion de las estadisticas demograficas o economicas es un 
paso importante para valorar el trabajo del estadistico y fomentar 
la cooperacion en censos y encuestas. 

En este fichero se ha usado un codigo para agrupar los paises en 
funcion de la zona geografica y desarrollo economico. Los alumnos 
podrian sugerir otras variables de clasificacion de los paises o anadir 
otras variables o paises al fichero. El trabajo con un fichero completo, 
en lugar de centrarse en variables aisladas, supone el inicio de una 
filosofia multivariante donde cada variable cobra su importancia, 
o bien, es explicada en funcion del resto y donde el alumno puede 
tratar de comprobar sus conjeturas con la incorporacion de nuevas 
variables al estudio. 

La figura 16 muestra un diagrama de barras donde representamos 
el numero de paises en los diferentes grupos de paises. A partir 
del mismo es facil construir una tabla de frecuencias y discutir el 
significado de las frecuencias absolutas, relativas y porcentajes. Los 
alumnos pueden analizar las ventajas que el diagrama de barras 
tiene frente a la tabla para visualizar el grupo que tiene mayor / 
menor numero de paises. Asimismo pueden elaborar otros graficos 
adecuados para representar esta variable. 
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■ Frecuencia 


Figura 16. Numero de paises por grupo. 

2. En las figuras 17 y 18 hemos representado el numero promedio 
de habitantes en cada pais, segun grupo, usando dos promedios 
diferentes: media y mediana. iPor que las dos graficas 
son tan diferentes? iElegirias la media o la mediana para 
representar el numero tipico de habitantes en los paises, 
segun la zona geografica? 

La elaboracion de una tabla o un grafico ya supone una primera 
reduccion de los datos, pero a veces queremos hallar un unico 
valor representativo de la distribucion. Esta actividad puede 
realizarse a partir de las graficas ya elaboradas o tambien pedir a 
los alumnos que las construyan previamente. 

En el segundo caso, la clase puede dividirse en grupos para calcular 
estos promedios, asi como la moda, y para explicar lo que representa 
cada uno de estos promedios y elegir en cada grupo el que mejor lo 
representa, argumentando la eleccion. Se puede pedir a los alumnos 
que sehalen las principales diferencias entre los dos graficos y que 
decidan cual de los dos promedios acentua mas las diferencias 
explicando la razon 

Mientras la media puede, en este ejempio, interpretarse como 
el reparto equitativo (numero de habitantes) entre todos los 
habitantes de cada zona geografica, la mediana indica simplemente 
el numero de habitantes que tuviesen tantos paises con menos o 
mas habitantes que el. La diferencia mas importante se observa en 
Asia, porque como China e India tienen una poblacion tan grande, al 
calcular la media, los valores de la variable en estos dos paises hacen 
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subir mucho el resultado. Los estudiantes pueden comprobarlo, 
haciendo el calculo de media y mediana en los paises asiaticos. 

■ Num. medio habitantes (miles) 



Figura 17. Media del numero de habitantes en diferente zonas. 

La actividad servira para analizar algunas propiedades de la media 
aritmetica y mediana. Mientras que la media es muy sensible a los 
valores extremos, pues todos los valores intervienen en el calculo, la 
mediana es “robusta”, pues en su calculo no intervienen los valores, 
sino solo el orden relative de los mismos. 

El profesor puede recordar el significado de un valor atipico. 
China e India tendrian valores atipicos de la poblacion en este 
ejemplo. Finalmente, sera importante hacer ver a los estudiantes 
la importancia de decidir adecuadamente la medida de tendencia 
central para representar los dates. 

jLa media no seria en este case un buen representante, pues pocos 
paises asiaticos se verian representados si se dice que el numero 
promedio de habitantes es 162 millones! 


■ Num. medio habitantes (miles) 

36816 



Figura 18. Mediana del numero de habitantes en diferente zonas. 
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3. iQue representa el valor obtenido al calcular la media de la 
esperanza media de vida al nacer en estos 97 paises? iComo 
habria que hacer para calcular la esperanza media de vida al 
nacer en hombres y mujeres, si no tenemos en cuenta el pais 
de nacimiento? 

En este fichero las unidades estadisticas son agregados, lo que tiene 
repercusion en la interpretacion de los promedios de las variables; 
por ejempio, la media (simple) de todas las esperanzas de vida al 
nacer en los distintos paises no es igual a la esperanza global de vida, 
sino que esta tiene que ser calculada como una media ponderada en 
funcion del numero de hombres/mujeres de cada pais. 

Esto puede servir de reflexion sobre las diferentes unidades estadisticas 
que se usan en un estudio, la necesidad que a veces tenemos de 
trabajar con valores aproximados y la forma de combinar estudios 
parciales para obtener indices globales, asi como para reflexionar 
sobre las propiedades de los promedios y la comprension de las 
mismas por parte de los estudiantes (Tormo, 1995; Batanero, 2000). 
Esta misma observacion debe hacerse en la interpretacion de otros 
estadisticos, como los de dispersion o los coeficientes de correlacion. 
El profesor podria animar a los estudiantes a consultar otros datos 
estadisticos sobre agregados producidos por el Institute Nacional de 
Estadistica y ver la dificultad que a veces tiene decidir los agregados. 
En nuestro ejempio, Europa se ha dividido en dos partes; Oriental 
y Occidental, y algunos paises como Estados Unidos o Japon se 
ban anadido a Europa Occidental. Con ejemplos sencillos se podria 
conducir a los alumnos a la idea de media ponderada y hacerles ver 
la necesidad de tener en cuenta el numero de hombres y mujeres de 
cada pais para calcular el promedio. 

4. Nosotros hemos calculado la esperanza media de vida 
global en hombres y mujeres, ponderando los datos de cada 
pais por SU numero de habitantes (suponiendo un numero 
aproximadamente igual de hombres y mujeres). En la figura 
19 hemos representado la esperanza media de vida en 
hombres y mujeres con dos escalas diferentes. Compara 
estos dos graficos e indica si te parecen o no adecuados para 
representar la diferencia entre la esperanza de vida media 
de mujeres y hombres. Uno de los dos graficos obtuvo 
directamente del ordenador, mientras que el otro ha sido 
manipulado. Averigua cual ha sido manipulado. 

La finalidad de esta pregunta es concienciar a los estudiantes sobre 
la posibilidad de que una grafica sea manipulada para distorsionar la 
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informacion y tambien de la importancia de las escalas adecuadas 
en una grafica. Una persona culta debiera poder leer criticamente 
los graficos estadisticos que encuentra en la prensa, Internet, 
medios de comunicacion y trabajo profesional. Esto supone no 
solo la lectura literal del grafico, sino identificar las tendencias y 
variabilidad de los datos, asi como detectar los posibles errores 
conscientes o inconscientes que puedan distorsionar la informacion 
representada (Schield, 2006). Asimismo, debiera conocer los convenios 
de construccion de los diferentes tipos de graficos y ser capaz de 
construir uno correctamente. 


■ Esperanza de vida al nacer ponderada | Esperanza de vida al nacer ponderada 

por numero de habitantes por numero de habitantes 



Hombres Mujeres Hombres Mujeres 


Figura 19. Esperanza de vida media de hombres y mujeres. 

Monteiro y Ainley (2007) indican que la lectura de graficos en 
el contexto escolar es una tarea mas limitada que la posible 
interpretacion de estos en otras actividades de la vida diaria. La 
razon dada por los autores es que, mientras en la escuela solo 
pedimos a los estudiantes una respuesta correcta desde el punto 
de vista matematico, en contextos extraescolares intervienen 
tambien otros conocimientos no matematicos. En esta actividad 
tratamos de que los estudiantes sean criticos en la lectura 
de graficos similares a los que puedan encontrar en la vida diaria 
y tambien con el uso de las opciones por defecto del software 
estadistico, que no son siempre las mas adecuadas. 

5. Construye ahora una tabla de frecuencias que muestre la 
distribucion de las tasas de natalidad. 
iPor que en este caso conviene agrupar en intervalos? 
iQue representa la frecuencia dentro de un intervalo? 
iCuantos intervalos conviene usar en la tabla de frecuencias? 
iComorepresentariasgraficamente estos datos? iEssimetrica 
la distribucion? iComo cambia la representacion grafica al 
variar el numero de intervalos? iY si usamos intervalos de 
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distinta amplitud? iQue significa y como representarias 
la frecuencia acumulada? iQue posicion ocupa tu pais 
respecto a la tasa de natalidad? iHay algunos paises 
atipicos respecto a la tasa de natalidad? Para contestar 
esta y otras preguntas similares puedes usar el grafico del 
tallo y hojas (figura 20). 

Cuando la variable presenta un numero grande de valores, surge la 
necesidad de agrupacion. Ahora bien, no existe una regia fija sobre 
la forma de construir los intervalos de clase, aunque se recomienda 
un numero de intervalos aproximadamente igual a la raiz cuadrada 
del numero de datos. En esta actividad se muestra un ejempio de 
como en estadistica es posible tener mas de una solucion correcta 
al mismo problema y tambien como la forma del histograma varia 
en funcion de la eleccion de los intervalos. 

Junto con las representaciones graficas tradicionales, como diagramas 
de barras o histogramas, en el analisis exploratorio de datos aparecen 
nuevas representaciones como el diagrama de tallo y hojas o los 
graficos de cajas, cuya potencia exploratoria se acentua con el 
paso de una a otra representacion, asi como la seleccion de partes 
del fichero para realizar estudios comparatives; por ejempio, al 
comparar las variables en los distintos grupos de paises, que es el 
tema de la siguiente actividad. 

El interes no solo se centra en las tendencias, sino en la variabilidad, 
asi como el estudio de los valores atipicos. Vemos tambien como la 
idea de distribucion siempre es relativa a un colectivo; por eso un 
valor puede ser atipico dentro de un subconjunto de datos y no serlo 
en el global. 

0|99 

l|001111222223333333444444 

l|556778 

2|011222334 

2|677888899 

3|00111122234 

3|5568899 

4|011122224444 

4|55566677788888 

5|0012 

Figura 20. Grafico de tallo y hojas: tasa de natalidad. 
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Este diagrama conserva los valores originales de los dates y a la vez 
muestra la frecuencia de valores, asi como la moda. Es muy sencillo 
de construir y de determinar, a partir de el, la mediana y los cuartiles. 
Puede ser un paso previo a la construccion de una tabla de frecuencias 
o un histograma o bien al diagrama de frecuencias acumuladas (figura 
21). El diagrama de frecuencias acumuladas servira para determinar 
graficamente la mediana y para introducir la idea de percentiles de 
la distribucion. Sera interesante para cada alumno analizar en que 
percentil se encuentra su pais de origen respecto a cada una de las 
variables. 



0 10 20 30 40 50 60 

Tasa natalidad 


Figura 21. Grafico de frecuencias acumuladas. 

6. Diferencias en la tasa de natalidad. Una vez estudiada 
globalmente la tasa de natalidad dividiremos la clase en 
grupos para estudiar si es la misma en los diferentes grupos 
de paises. Investigaremos que grupos de paises tienen valores 
atipicos para la tasa de natalidad y que paises tienen una tasa 
de natalidad atipica respecto a su grupo, asi como por que 
al realizar un grafico global en todo el fichero no aparecen 
valores atipicos y si se muestran dentro de los grupos. Se pide 
listar todas las diferencias observadas en los diversos grupos 
de paises. 




















ELEMENTOS DE ESTADl'STICA Y SU 
DIDACTICA A NIVEL BACHILLERATO 

»>> 

* 79 

■_ 

2 


Pafses del grupo 1 
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1|22333 

11445 

1|7 
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Pafses del grupo 2 

1|8 

2|03 

2177889 

31224 
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Pafses del grupo 3 
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Pafses del grupo 4 
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3|1 
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Pafses del grupo 5 
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2|1123 
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3169 

41012 
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Pafses del grupo 6 
LO|31.1 

3| 

3| 

3|2 

3155 

3| 

4|1 

4|444455 
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Figura 22. Tasa de natalidad en los diferentes grupos de pafses. 

Los alumnos elaboraran graficos como los presentados en las figuras 
22, 23, 24. El grafico de tallo y hojas ha sido util para analizar las 
diferencias en la tasa de natalidad, pero tambien podemos usar 
otras representaciones, como diagramas de puntos y graficos 
de caja. Divididos en grupos, los alumnos pueden tratar de hallar 
representaciones alternativas que pongan de manifiesto las diferencias 
en la tasa de natalidad. Por ejempio, podemos observar las figuras 23 
y 24 y comparar con los graficos del tronco, senalando las ventajas 
que tiene cada una de las representaciones graficas y como podriamos 
cambiar cada grafica para resaltar mas (o menos) las diferencias. 
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Figura 23. Grafico de puntos. 


E. Oriental 
Iberoamerica 
E. Occidental 
Oriente Medio 
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Africa 
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Figura 24. Grafico de caja. 

7. Esperanza de vida en hombres y mujeres. Se dice, por 
ejempio, que las mujeres forman el sexo debil. Sin embargo, 
muchas chicas estarian en contra de esta opinion cuando 
comparen en algunos paises la esperanza de vida al nacer en 
hombres y mujeres. 

iHay mayor variabilidad entre paises en la esperanza de vida 
en hombres o en mujeres? iEn que porcentaje de paises la 
esperanza de vida de hombres (mujeres) es mayor de 58 anos? 
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iy de 68 anos? iCual es el valor de la esperanza de vida de 
modo que 70% de paises tiene una esperanza de vida mayor? 
iEs igual en hombres y mujeres? iComo podrias disimular la 
diferencia de esperanzas de vida en hombres y mujeres en 
cada grafico? 

En la actividad anterior hemos comparado una variable en distintos 
subconjuntosdepaises, peroa vecestienetambiensentidocomparar 
dos variables diferentes en el total de los datos. Podriamos investigar 
si la distribucion de la esperanza de vida en el total de paises es igual 
en hombres y mujeres analizando para ello los graficos de las figuras 
25 a 26 y contestar las preguntas anteriores. 


Hombres 


Mujeres 



Figura 25. Graficos de caja. Esperanza de vida en hombres y mujeres. 
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Figura 26. Histogramas. Esperanza de vida en hombres y mujeres. 


En esta actividad se vuelven a aplicar los conceptos aprendidos al 
estudio de las diferencias de dos variables en una misma muestra. Se 
aplica tambien el estudio de las frecuencias acumuladas, percentiles 
y sus ranges. Hacemos notar que el calculo de percentiles y sus 
ranges puede hacerse directamente a partir de la grafica sin tener 
que recurrir a las formulas de calculo que son complejas y para las 
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Grafico de cuantiles 



Figura 27. Distribucion acumulativa de la esperanza de vida en hombres y mujeres. 

que existe una variedad de cases, segun las variables esten o no 
agrupadas en intervales. 

Actividades de ampliacion 

8. Relacion de la esperanza de vida con otras variables. En la 
figura 28 hemes representado los diagramas de dispersion de 
la esperanza de vida del hombre en cada pais, en funcion de d i ve rsas 
variables. iQue variables estan relacionada con la esperanza 
de vida del hombre? iEn cual es la relacion directa o inversa? 
iCuales influyen o son influidas per la esperanza de vida del 
hombre? iCual sirve mejor para predecir la esperanza de vida? 
iEn que casos la relacion podria ser debida a otras variables? 
<:Podriamos en alguno de los casos hallar una funcion 
matematica para predecir, aproximadamente, la esperanza 
de vida del hombre a partir de la otra variable? iQue tipo de 
funcion? 

Al analizar las relaciones entre dos variables numericas los alumnos 
deben de extender la idea de dependencia funcional a dependencia 
aleatoria y diferenciar sus tipos (lineal o no; directa e inversa), 
asi como graduar, al menos intuitivamente, la intensidad de la 
relacion. Es importante tambien diferenciar correlacion y causalidad 
y analizar los distintos tipos de relaciones que pueden llevar a la 
existencia de correlacion: dependencia causal; interdependencia, 
dependencia indirecta, concordancia y correlacion espuria (Estepa, 
1995). Una vez detectada la correlacion, el interes se centra en la 
busqueda de modelos que puedan predecir las variables explicadas 
en funcion de las variables explicativas, lo que de nuevo conecta con 
otro contenido del curriculo de matematicas: las funciones. 
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Figura 28. Relacion de la esperanza de vida del hombre con otras variables. 


9. Regresion. Estudiemos con mas detalle la tasa de natalidad 
en funcion del PNB. iCual es el valor del coeficiente de 
correlacion? iQue te indica? Si utilizamos una recta para 
predecir la tasa de natalidad en funcion del PNB, iseria un 
buen modelo de prediccion? iPodriamos mejorar la prediccion 
cambiando el tipo de funcion? 

Con alumnos universitarios se puede proceder al estudio mas formal 
de la regresion, primero calculando el coeficiente de correlacion, que 
en este caso (Tabla 3) es alto y negativo. 

No obstante el alto valor de coeficiente, por si solo no es indicative 
de una relacion lineal entre las variables, por lo que conviene 
representar graficamente los datos en un diagrama de dispersion 
(figura 29). En el diagrama de dispersion y el coeficiente de 
correlacion se observa una relacion inversa, ya que a mayor tasa 
de natalidad menor PNB, pero no lineal. 
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Tabla 3. Resumen del modelo. 


Modelo 

R 

R cuadro 

R. cuadro 
corregida 

Error tip. de la 
estimacion 

1 

-.629(a) 

.396 

.389 

10.70878 


(a) Variables predictoras: (Constante), Producto nacional bruto en millones de dolares. 



Figura 29. Diagrama de dispersion. 

Tabla 4. Resumen del modelo y estimaciones de los parametros. 


Resumen del modelo Estimaciones de los parametros 


Ecuacion 

R2 

F 

gii 

gl2 

Sig. 

Constante 

bl 

b2 

b3 

Lineal 

.396 

58.282 

1 

89 

.000 

35.537 

-0.001 



Logan'tmica 

.542 

105.278 

1 

89 

.000 

75.521 

-6.132 



Cuadratica 

.454 

36.645 

2 

88 

.000 

37.737 

-.002 

5.49E-8 


Cubica 

.481 

26.898 

3 

87 

.000 

39.644 

-.004 

2.19E-3 

-3.62E-12 

Potencia 

.553 

110.165 

1 

89 

.000 

157.069 

-.240 



Exponencial 

.446 

71.554 

1 

89 

.000 

33.352 

-4.37E-05 




a La variable independiente es producto nacional bruto en millones de dolares 

La proporcion de la varianza de la tasa de natalidad explicada por 
el PNB con un modelo lineal es 38.90 %. Luego se puede tratar de 
comparar otros posibles modelos, es decir, otras posibles curvas 
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que se ajusten mejor a los dates que un modelo lineal (recta). 
Estudiando otros modelos diferentes (tabla 4), el que mayor 
porcentaje de varianza ofrece es el de potencia o el logaritmico. En 
el cuadro anterior obtenemos las estimaciones de los parametros. 
Graficamente vemos que el ajuste es mejor que el caso lineal 
(figura 30). 



Figura 30. Ajuste de un modelo. 


10. Estudiemos ahora que otras variables se relacionan linealmente 
con la tasa de natalidad y tratemos de encontrar una funcion 
que prediga la tasa de natalidad en funcion de estas variables. 

Estudiando las correlaciones (tabla 5) vemos que todas son 
significativas, siendo la mas alta las esperanzas de vida (inversa) 
y a continuacion la mortalidad infantil. La natalidad aumenta si 
hay mucha mortalidad infantil y poca esperanza de vida. Se puede 
intentar ajustar una ecuacion con mas de una variable dependiente, 
introduciendo paso a paso aquellas que tienen mas correlacion con 
la dependiente. 

En la regresion por pasos (tabla 6) solo se incluyen dos variables en la 
ecuacion, que ya explican 83% de la varianza (esperanza de vida de 
la mujer y tasa de mortalidad). 

El resto de las variables se excluye porque no hacen mejorar el 
modelo. Los coeficientes permiten escribir la ecuacion de regresion 
que aparece en la (tabla 7). Prediciendo la esperanza de vida del 
hombre en funcion de la esperanza de vida de la mujer y la tasa de 
natalidad se obtiene un modelo suficientemente explicativo. 
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Tabla 5. Resumen del modelo y estimaciones de los parametros. 


Tasa de natalidad 


Tasa de 

Correlacion de Pearson 

,486(**) 

mortalidad 

Sig.(bilateral) 

,000 

Mortalidad 

Correlacion de Pearson 

,858(**) 

infantil 

Sig.(bilateral) 

Esperanza de vida 
al nacer en el 
hombre 

Correlacion de Pearson 
Sig.(bilateral) 

,867(**) 

,000 

Esperanza de vida 
al nacer en la 
mujer 

Correlacion de Pearson 
Sig.(bilateral) 

,894(**) 

,000 

Producto nacional 
bruto en millones 
de dolares 

Correlacion de Pearson 
Sig.(bilateral) 

,629(**) 

,000 


••La correlacion es significativa al nivel 0,01 (bilateral). 


Tabla 6. Resumen del modelo. 


Estadi'sticos de cambio 

Sig. del 


Modelo 

R 

R" 

R2 

corregida 

Error tip. 
estimacion 

Cambio 

R^ 

Cambio en 

F 

gl 1 

gl 2 

cambio 

F 

1 

,894(a) 

,800 

,798 

6,16040 

,800 

356,051 

1 

89 

,000 

2 

,915(b) 

,837 

,833 

5,60090 

,037 

19,669 

1 

88 

,000 


(a) Variables predictorias: (Constante), esperanza de vida al nacer en la mujer. 

(b) Variables predictorias: (Constante), esperanza de vida al nacer en la mujer, 
tasa de mortalidad. 
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Tabla 7. Coeficientes (a). 


Modelo 


Coeficientes no 
estandarizados 

Coeficientes 

estandarizados 

t 

sig. 



B 

Error 

tip. 

Beta 



2 

(Constante) 

126,602 

6,558 


19,304 

,000 


Esperanza de 
vida al nacer 
en la mujer 

-1,341 

,076 

-1,090 

17,685 

,000 


Tasa de 
mortalidad 

-,799 

,180 

-273 

-4,435 

,000 


a Variable dependiente: tasa de natalidad. 

Se podria completar el estudio con contrastes de diferencias de 
medias. La diferencia de esperanzas de vida en hombres y mujeres 
se podria estudiar mediante la prueba t de muestras relacionadas 
(tablas 8 y 9). La diferencia de cualquiera de las variables en las 
diferentes zonas tambien se podria estudiar mediante analisis de 
varianza de una via (tablas 10 y 11). 

Tabla 8. Estadfsticos de muestras relacionadas. 



Media 

N 

Desviacion 

tipica 

Error tip. 
media 

Esperanza 
Par 1 de vida 

61,4856 

97 

9,61597 

,97635 

hombre 





Esperanza 
de vida 

66,1511 

97 

11,00539 

1,11743 

mujer 






Tabla 9. Prueba de muestras relacionadas 



Diferencias relacionadas 

t gi 

Sig. 

(bilateral) 

Media 

Desviacion 

tip. 

Error tip. de 
la media 

95% intervalo de 
confianza para la 
diferencia 



-4.665 

2,37112 

.24075 

-5,14345 -4.18768 

-19,379 96 

.000 
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Tabla 10. Descriptivos (tasa de natalidad). 




Media 

Desviacion 

tipica 

Error 

tipico 

1. confianza 
media 95% 

Minimo 

Maximo 

Europa 

Oriental 

11 

14,76 

3,69 

1,11 

12,28 

17,24 

11,60 

24,70 

Sudamerica 

12 

29,17 

7,38 

2,13 

24,48 

33,86 

18,00 

46,60 

Europa 

Occidental 

19 

12,85 

1,94 

44,547 

11,91 

13,78 

9,70 

16,70 

Japon u 
Oriente 
Medio 

11 

33,90 

8,62 

2,60 

28,10 

39,69 

22,30 

45,60 

Asia 

16 

30,00 

9,05 

2,26 

25,1731 

34,82 

11,70 

42,20 

Africa 

27 

44,52 

5,68 

1,09 

42,2767 

46,77 

31,10 

52,20 

Total 

96 

29,28 

13,60 

1,38 

26,5330 

32,04 

9,70 

52,20 


Tabla 11. ANOVA 


Suma de cuadrados 

gi 

Media cuadratica F 

Sig. 

Inter-grupos 

13964,322 

5 

2792,864 69,441 

,000 

Intra-grupos 

3619,747 

90 

40,219 


Total 

17584,070 

95 




Algunas dificultades y errores previsibles 

Lectura de graficos 

En proyectos anteriores hemos analizado algunos niveles de lectura 
de los graficos. Cuando los niveles de lectura de graficos descritos se 
aplican no solo a su interpretacion, sino a su valoracion critica, los 
niveles superiores descritos antes se modifican ligeramente (Aoyama 
y Stephen, 2003; Aoyama, 2007). 

Supongamos, por ejempio, que se da a los estudiantes un grafico que 
presenta datos sobre el numero de horas que los adolescentes dedican 
a jugar con la videoconsola y el numero de episodios de violencia 
escolar en que se ven implicados. Dicha grafica muestra claramente un 
crecimiento del numero de episodios de violencia cuando aumenta el 
tiempo dedicado a este tipo de juegos. Se pregunta a los estudiantes 
si piensan que la violencia escolar disminuiria si se prohibiesen las 
videoconsolas. Una vez que los estudiantes llegan a la fase superior en 
la clasificacion de Friel, Curcio y Bright, todavia podriamos diferenciar 
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tres grupos, en funcion de su capacidad de critica de la informacion 
representada: 

• Nivel racional/literal. Los estudiantes leen correctamente el 
grafico, incluyendo la interpolacion, deteccion de tendencias 
y prediccion. Para responder la pregunta planteada, usan las 
caracteristicas del grafico, pero no cuestionan la informacion, 
ni dan explicaciones alternativas. Una respuesta tipica a la 
pregunta planteada seria “Si, ya que el grupo de chicos que 
jugo juegos durante mucho tiempo tambien tuvo muchos 
episodios de violencia” 

• Nivel cntico. Los estudiantes leen los graficos, comprenden 
el contexto y evaluan la fiabilidad de la informacion, 
cuestionandola a veces, pero no son capaces de buscar 
otras hipotesis: “Pienso que no, pues aunque los que mas 
juegan aparecen como mas violentos en el grafico, podria 
haber otras causas, aunque no me imagine cuales” 

• Nivel hipotetico-. Los estudiantes leen los graficos, los interpretan 
y evaluan la informacion, formando sus propias hipotesis y 
modelos: “No estoy de acuerdo en que la causa de la violencia 
sea el juego; quizas la falta de atencion de los padres puede 
llevar a la vez a que el chico sea violento y que dedique mas 
boras a jugar con la consola”. 

Medidas de posicion central 

En este proyecto los dates originales son medias ponderadas, 
tema en que los estudiantes tienen dificultades. Pollatsek, Lima 
y Well (1981) encontraron que incluso alumnos universitarios no 
ponderan adecuadamente los valores y en ocasiones usan la media 
simple, en lugar de la media ponderada. 

Li y Shen (1992) indican que cuando se pide a los estudiantes 
calcular la media a partir de una tabla de frecuencias donde los 
dates se agrupan en intervales, los estudiantes olvidan con 
frecuencia que cada uno de estos grupos debe ponderarse de 
mode distinto al calcular la media. 

En otros cases el algoritmo se aplica de forma mecanica sin comprender 
su significado. Cai (1995) encontro en su investigacion que mientras 
la mayoria de alumnos de 12-13 afios eran capaces de aplicar 
adecuadamente el algoritmo para calcular la media, solo algunos eran 
capaces de determinar un valor desconocido en un conjunto pequefio 
de dates para obtener un valor medio dado. Incluso, encontrando 
el valor desconocido, fueron pocos los que lo hicieron a partir de un 
uso comprensivo del algoritmo, multiplicando el valor medio por el 
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numero de valores para hallar la suma total. La mayoria simplemente 
uso el ensayo y error. 

Otros errores de calculo en media, mediana y moda descritos por 
Carvalho (1998) al analizar las producciones escritas de los alumnos 
al resolver tareas estadisticas son los siguientes: 

• Moda: tomar la mayor frecuencia absoluta. 

• Mediana: no ordenar los datos para calcular la mediana; 
calcular el dato central de las frecuencias absolutas ordenadas 
de forma creciente; calcular la moda en vez de la mediana; 
equivocarse al calcular el valor central. 

• Media: hallar la media de los valores de las frecuencias; no 
tener en cuenta la frecuencia absoluta de cada valor en el 
calculo de la media. 

En realidad, el calculo de la mediana es complejo, porque el algoritmo 
de calculo es diferente, segun tengamos un numero par o impar de 
datos, y segun los datos se presenten en tablas de valores agrupados 
o sin agrupar (Cobo y Batanero, 2000) y tambien el valor obtenido 
es diferente, segun se aplique uno u otro algoritmo. Esto puede 
resultar dificil para los alumnos que estan acostumbrados a un 
unico metodo de calculo y una unica solucion para los problemas 
matematicos. 

Gattuso y Mary (1998, 2002) analizan la evolucion de la comprension 
del algoritmo de calculo de la media ponderada de los alumnos 
durante la ensehanza secundaria, usando problemas con diferentes 
contextos y forma de representacion. Las tareas presentadas 
fueron: calculo de medias ponderadas, efecto que el cambio de un 
dato produce sobre la media y hallar un valor faltante en un conjunto 
de datos para obtener un promedio dado. Identifican las siguientes 
variables didacticas que afectan a la dificultad de las tareas: formato 
(tabla, serie de numeros, grafico), si los valores de las variables son o 
no mucho mayores que los de las frecuencias (lo que influye en que 
el niho discrimine los dos conceptos); si una de las frecuencias es 
mucho mayor que las otras (de modo que se fuerce al nino a tener 
en cuenta las frecuencias). Observaron el efecto de estas variables y 
tambien la mejora con la instruccion, aunque no fue muy persistente 
en el tiempo. 

Correlacion y regresion 

La asociacion estadistica extiende la idea de dependencia funcional, 
y es relevante en muchos metodos de gran variedad de ciencias. 
Mientras que en una dependencia de tipo funcional a cada valor 
de una variable independiente X corresponde un solo valor de otra 


ELEMENTOS DE ESTADl'STICA Y SU 
DIDACTICA A NIVEL BACHILLERATO 



variable dependiente Y, en el caso de asociacion a cada valor de X 
corresponde una distribucion de valores de Y. Ademas se puede 
definir una medida de la intensidad de la asociacion, que varia 
entre 0 (independencia total) y 1 (asociacion perfecta), utilizando 
coeficientes como el de correlacion (para variables cuantitativas) o 
el coeficiente de contingencia (para variables cualitativas). 

Las dificultades y errores en torno a estas nociones, descritas por la 
investigacion psicologica, estan ligadasa las ideas de condicionamiento 
ycausalidad.aunqueestosconceptossondiferentes.DiazydelaFuente 
(2005) analizan las relaciones entre causalidad y condicionamiento, 
que son inherentes a un problema de asociacion, puesto que las 
personas construimos nuestro conocimiento del mundo sobre la 
base de relaciones de causa y efecto entre diferentes sucesos. 
Desde el punto de vista de la probabilidad, si un suceso A es la causa 
estricta de un suceso B, siempre que suceda A, sucedera B, por lo que 
P(B/A) = 1 y habra una asociacion entre A y B. Las autoras indican 
que una relacion causal determinista es menos frecuente que una 
aleatoria, donde, cuando sucede A cambia la probabilidad de que 
ocurra B. Una relacion de causalidad implica una asociacion, pero no 
al contrario, pues dos sucesos o variables pueden estar asociados 
sin que uno de ellos sea causa del otro. Una asociacion estadistica 
entre variables puede deberse a otras variables intervinientes o 
incluso ser espurea y no implica relacion causal. 

Otros sesgos descritos relacionados con la comprension de la idea de 
correlacion citados por Engel y Sedimeier (2011) son los siguientes: 

• Influencia de las creencias previas o correlacion ilusoria, que 
consiste en formarse teorias propias sobre la relacion que existe 
entre dos variables, que no se apoya en los datos empiricos. 

• Desestimar el efecto de regresion, por el cual, despues de 
que aparece un caso atipico, suele haber una vuelta a los 
valores mas comunes. Asi, los hijos de padres muy altos 
suelen ser altos, pero no tanto como sus padres. 

• No tener en cuenta el efecto de terceras variables que 
pueden hacer creer en la existencia de una correlacion 
cuando esta no existe. 

En la investigacion en didactica de la matematica se ban encontrado 
las siguientes dificultades adicionales: 

• Distinguir si las dos variables presentadas en la tarea 
conforman una distribucion bidimensional (Estepa, 2007). 
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La mayoria de los alumnos relaciona el signo de la 
covarlanza con el tipo de correlacion directa o inversa, y se 
tiene dificultad en relacionar su magnitud con la intensidad 
o relacionar los coeficientes de regresion con el signo de la 
correlacion (Sanchez-Cobo 1999; Estepa, 2007). 
Considerar tan solo la correspondencia de datos 
bidimensionales aislados, en lugar de considerar la tendencia 
global de estos (Moritz, 2004). 

Estimar el coeficiente de correlacion desde otras 
representaciones (verbal tabular, etc.) distintas de 
la representacion grafica (diagrama de dispersion). 
En este sentido, destacar la importancia del trabajo con 
distintos objetos matematicos cuya comprension y dominio 
permitiran llevar a cabo procesos de traduccion entre 
diferentes representaciones de la asociacion estadistica 
(verbal, tabular, grafica o numerica) (Sanchez Cobo, 1999; 
Moritz, 2004). 

Ordenar adecuadamente diferentes valores del coeficiente 
de correlacion distintos de: -1, 0 y 1. Aunque tienen 
presente que la intensidad de la dependencia se obtiene a 
partir del coeficiente de correlacion, presentan dificultades 
en estas comparaciones, debido a que usan indebidamente 
sus conocimientos sobre el orden en numeros enteros 
(Sanchez-Cobo, 1999). 

Dificultad de diferenciar la variable explicativa de la 
explicada en el calculo de la recta de regresion. En 
la investigacion de Sanchez-Cobo, dos de cada cinco 
estudiantes, aproximadamente, relacionan que ambas 
rectas de regresion son perpendiculares cuando el 
coeficiente de correlacion es nulo, evidenciandose que 
se considera casi en exclusiva, la modelizacion de ajuste 
lineal. En concrete, casi la mitad de los sujetos del estudio 
consideran que si existe correlacion positiva, esta se deduce 
en una dependencia lineal. 

Transitividad de la correlacion. Se piensa que si una variable 
A esta correlacionada con otra B y esta se relaciona con una 
variable C, las variables A y C debieran estar correlacionadas, 
pero en general, la correlacion no es transitiva. Esto se debe 
a una extrapolacion de propiedades que se cumplen en otras 
relaciones (como la de orden). Esta creencia es denominada 
Concepcion transitiva de la asociacion (Sotos, Vanhoof, Van 
Den Noortgate y Onghena, 2009). 
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Por otra parte, el estudio de la regresion ofrece al alumno una buena 
ocasion de aplicar sus conocimientos previos sobre la funcion lineal 
y otras funciones sencillas. El profesor debe advertir sobre el uso 
inadecuado del razonamiento proporcional en el trabajo con la 
recta de regresion (Estepa, 2008) y recordar que, en general, no se 
puede despejar la variable independiente para encontrar la linea de 
regresion de X sobre Y, porque el criterio de ajuste es diferente del 
seguido en la construccion de la recta de regresion de Y sobre X. 
Otras dificultades 

En este fichero las unidades estadisticas son agregados, lo que tiene 
repercusion en la interpretacion de los promedios de las variables; 
por ejempio, la media (simple) de todas las esperanzas de vida al 
nacer en los distintos paises no es igual a la esperanza global de vida, 
sino que esta tiene que ser calculada como una media ponderada en 
funcion del numero de hombres/mujeres de cada pais. Esto puede 
servir de reflexion sobre las diferentes unidades estadisticas que 
pueden usarse en un estudio, la necesidad que a veces tenemos de 
trabajar con valores aproximados y la forma de combinar estudios 
parciales para obtener indices globales, asi como para reflexionar 
sobre las propiedades de los promedios y la comprension de las 
mismas por parte de los estudiantes (Tormo, 1995; Batanero, 
2000). Esta misma observacion debe hacerse en la interpretacion 
de otros estadisticos, como los de dispersion o los coeficientes de 
correlacion. 

El trabajo con analisis exploratorio de datos refuerza algunos objetivos 
sugeridos para la educacion matematica en los nuevos curriculos 
de secundaria, como el trabajo con problemas abiertos, el uso de 
sistemas multiples de representacion, la introduccion al trabajo con 
ordenadores o calculadoras graficas y la conexion de las matematicas 
con otras areas del curricula (Shaughnessy, Garfield y Greer, 1997). 
Pero el razonamiento estadistico va mas alia del conocimiento 
matematico y de la comprension de los conceptos y procedimientos. 
La modelizacion, la valoracion de la bondad del ajuste de los modelos 
a la realidad, la formulacion de cuestiones, la interpretacion y 
sintesis de los resultados, la elaboracion de informes son tambien 
componentes esenciales de las capacidades que queremos 
desarrollar en nuestros alumnos. Los estudiantes, acostumbrados 
a que en la clase de matematicas cada problema tenga una unica 
solucion, podrian encontrar complejo el trabajo con los proyectos y 
la existencia de diferentes procedimientos y soluciones correctas. 
Es labor del profesor acostumbrarles al metodo y razonamiento 
estadistico. 
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Los estadisticos de orden pueden plantear problemas, ya que la 
funcion de distribucion de la variable discreta tiene discontinuidades 
de salto y los alumnos no estan acostumbrados a este tipo de 
funciones. Asimismo, alguno de ellos pudiera tener deficiencias en 
el razonamiento proporcional. 

Analisis del contenido estadistico 

En este proyecto podemos identificar, explicita o implicitamente, los 
siguientes contenidos: 

1. Aplicaciones de la estadistica-. 

• Estudios demograficos y socioeconomicos. 

• Estadisticas oficiales; organismos y procedimientos en la 
elaboracion de estadisticas oficiales. 

• Fuentes de datos estadisticos: anuarios estadisticos. 

• fuentes de datos en Internet. 

• Ajuste de modelos a datos. 

2. Conceptos y propiedades: 

• Agrupacion de variables en intervalos, efectos de la 
agrupacion. 

• Medidas de posicion central: medias ponderadas, percentiles, 
ranges de percentiles. 

• Valores atipicos y su efecto sobre los promedios. 

• Asociacion y sus tipos: directa/inversa; lineal/no lineal; 
asociacion y causalidad. 

• Correlacion. Interpretacion del signoy la intensidad, proporcion 
de varianza explicada. 

• Modelos: ajuste de modelos sencillos a datos bivariantes; 
uso de modelos en la prediccion. Funcion lineal, cuadratica, 
logaritmica, exponencial. 

• Contraste de hipotesis: contraste de diferencia de medias 
en muestras relacionadas. 

• Intervalo de confianza para la diferencia de medias en 
muestras relacionadas. 

• Analisis de varianza de un factor, efectos fijos. Variable 
dependiente y factor. 

3. Notaciones y representaciones: 

• Palabras como intervalos, extremos y marcas de clase, 
percentiles y sus ranges, cuartiles, valores atipicos. 
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asociacion, correlacion, regresion, etc. 

• Simbolos usados para los diferentes estadisticos y otros 
como el sumatorio. 

• Graficos de barras, diagramas acumulativos, diagrama 
de tallo y hojas, graficos de caja, graficos de cuantiles, 
diagramas de dispersion. 

4. Tecnicas y procedimientos: 

• Busqueda de datos a partir de anuarios estadisticos o de 
Internet. 

• Elaboracion de tablas de frecuencia con datos agrupados, 
desarrollo de graficos de tallo y hojas, graficos de caja, 
graficos de cuantiles y diagramas de dispersion. 

• Interpretacionde tablas y graficos: elaboracion deconclusiones 
a partir del analisis de tablas y graficos. 

• Elaboracion de argumentos y conclusiones a partir del 
analisis de datos. 

• Estimacion de parametros en modelos de regresion. 

• Uso de calculadora grafica, hojas de calculo o software 
estadistico. 

• Comparacion de muestras relacionadas: contrastes e 
intervalos de confianza. 

• Analisis de varianza, calculo e interpretacion. 

5. Actitudes: 

• Valorar la utilidad y complejidad de la elaboracion de las 
estadisticas oficiales y resaltar la importancia de su 
colaboracion en encuestas y censos para obtener datos 
fiables. 

• Concientizar al alumno sobre la importancia de las 
representaciones graficas y la posibilidad deque se transmita 
informacion sesgada en una grafica mal construida. 

• Fomentar un espiritu critico en el uso de paquetes estadisticos 
y sus opciones por defecto. 
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